tf安装指坑

0. 前言本次项目是在我中了项目书重新回顾了PEBG的代码准备尝试给他跑起来 本次差不多我认真的时间应该是花了4-5天的样子 在这次坑里面 我花费了30大洋 其中20找了个人帮我看了看代码(是真的只是看了看然后给俺发了个require...

git代理

这个问题碰到很多次了 每次安装git的时候都需要查查 123456789# 设置代理git config --global http.proxy 'socks5://127.0.0.1:1080' git conf...

学术不端

先看看学术不端的定义 学术不端主要指学者涉及抄袭、剽窃的不良行为,也指学者恶意的一稿多投行为。抄袭主要指抄袭者将被抄袭者的文字,不加修改地移入自己的论著,并当作自己的成果发表;剽窃主要指剽窃者将被剽窃者的文字或学术观点,经过改造后移入...

判断创新

多头注意力换头数(换超参数)不行 n=8 换成 16 不行 比如有人用 elmo 做了词向量,然后我用bert 做词向量去做下游任务如果你是第一个,大概率可以, (水一篇水刊水文)然后就编故事这个领域有了什么问题,然后我用 ...

没有继承且无法复现论文模型

找大量的论文,这个论文一定要附代码,如果没有附代码直接 pass 没有代码,我们手动构建(基本弄不出来) 论文里面提出来了(如果没提出来 就可以找下一篇) 去找作者要(尤其是和机构合作的论文) 去github去搜 模型一定可以调通...

sci写作

模型确定 结果正在跑(或已结束) 目标期刊已定,一般可以定顶刊 从目标期刊中打印3-5份最近论文定模板 第一次写没必要注意排版格式 从方法开始写 ApproachBasic module用的一些小模块,简单讲, 不要把你懂得当...

服务器使用的问题

当我们拿到了ip和密码 我们要干的活如下: 连接服务器 配置conda运行环境 上传数据集 配置conda jupyterab kernel(内核) jupyterlab使用 配置pycharm远程连接 还有一个 是我在编码过程中...

双塔那些事儿

推荐系统的双塔 解耦 user 和 item,部署时可分离 双塔训练训练方式三种训练方式 pointwise pairwise n对pairwise – listwise softmaxwise 样本选择正: 用户点击物品 负:...

lite transformer讲解

传统transformer 传统 input 通常包含 数据的长度N 数据的维度d 模型参数量与性能对比 d下降的情况下,会导致attention单元 上下文捕捉关系不足,导致效果差 d不变的情况下,会导致参数量变多,上下文捕获好,效...