法袍的合影,而是配了一张所有人都眼熟能详的。
吔S啦你。(成熟的读者应当自己补图)
在AI领域,由于AI的黑箱特性,导致抄袭和套皮相比其他IT领域有很大的不一样。
针对一个复杂系统来说,套皮是很麻烦的一件事,亿级的代码量,哪个边边角角有点注释什么的,可能就会露馅。
但大模型不是个软件系统,而是是几十上千甚至上万亿参数组成的神经网络,这使得抄袭和套皮行为难以直接通过代码检查来识别,因为大模型的核心是参数而非显式的代码逻辑。
而模型中的知识,只要重复训练的次数足够多,是能够把过去的知识彻底清洗覆盖掉的。
这也是为什么当初斯坦福的两个学生胆子会大到将清华的llama小钢炮直接套皮说成自己做的大模型。
这件事在爆出来之初,也只是有人从性能上怀疑,因为这三个学生拿出的模型性能表现和小钢炮太像了。
这时候这三个人都没有承认是套皮。
只不过他们只是学生,算力和数据都不太够,无法彻底完成模型的知识覆盖,致使他们的模型居然能和小钢炮的专有特性一样可以识别清华简,这才实锤了他们套皮抄袭。
小钢炮事件之所以能够这么快解决,是因为小钢炮推出的比三个学生拿出的模型早的多,早就打出了名气,再加上有独有特性。但如果抄袭的不是三个学生,而是资源更丰富的大厂呢?如果两者是同时推出的,几乎没有先后呢
59309836
画画太岁提醒您:看完记得收藏【流行中文】 www.lxgh.net,下次我更新您才方便继续阅读哦,期待精彩继续!您也可以用手机版:m.lxgh.net,随时随地都可以畅阅无阻...