然代码里没有,但它确实是真实存在的。
不过人工筛选终究是有一些小问题的,在金融这个反人类的领域,光凭经验很多时候容易做出错误的判断。
“也就是说,在数据融合的时候,缺少了一个‘智能筛选’的步骤,让模型知道,哪些数据重要,哪些数据不重要。”
“数据筛选.......”周昀手指轻轻敲打着桌面,思考着解决办法。
如果只是单纯的逻辑判断,肯定不行,这样太死板,还不如人来筛选。
置信度?
周昀想了一下,也觉得不行。
置信度其实就是模型对自己输出结果的把握大小,例如一个分类任务,最终模型的输出会在softmax函数的作用下,变成一连串的概率,
比如分类到a的概率为80%,b任务的概率为10%以此类推。
那么置信度就是采用概率大于一定数值的结果。
这东西听上去玄乎,实际上也是一种比较死板的逻辑判断。
除了这两种,筛选数据的方法其实还有很多,不过周昀都不满意,因为这些方法从他们的底层逻辑来看,都没有达到他想要看到的“智能”。
突然,周昀手指一顿。
如果从另一方面来看,数据筛选,还可以看作是一种数据蒸馏。
数据蒸馏其实很好理解,蒸馏大家都知道,那么数据蒸馏就是通过某种手段将数据集提纯的方法。
恰好,周昀发在neurips上的agileedge这篇论文里就有一种数据蒸馏的方法,因为想要缩小模型,就等于缩小参数量,两者之间其实有着异曲同工之妙。
直接拿过来用肯定不行,不过周昀感觉只要稍作修改,应该能达到他想要的效果,因为当初设计这种数据蒸馏方法的时候,就已经着眼于“智能”二字。
找到
本网站为网友提供小说上传储存空间平台,为网友提供在线阅读交流、txt下载,平台上的所有文学作品均来源于网友的上传
用户上传的文学作品均由网站程序自动分割展现,无人工干预,本站自身不编辑或修改网友上传的内容(请上传有合法版权的作品)
如发现本站有侵犯权利人版权内容的,请向本站投诉,一经核实,本站将立即删除相关作品并对上传人ID账号作封号处理