Meta大模型成了“科学造假发动机”，发布3天就在争议中下架( 二 ) _推特

除了文本、数学公式、代码任务之外，它还可以执行化学式、蛋白质序列等多模态任务。

文章插图

Galactica 1200亿参数版本在许多科学类任务上性能超越OpenAI的GPT-3、DeepMin的Chinchilla与Gopher、以及开源的BLOOM 。

文章插图

然鹅，测试基准毕竟是死的，一旦进入生产环境开放给用户，还是会出现开发时预料不到的情况。

文章插图

问题出在哪？
在Hacker News上有人认为，语言模型终究是在“对语言建模”而不是对内容。
就像AI绘画模型一样，你让它画“骑马的宇航员”它就能画出来，虽然这不太可能发生，但是很有趣。

文章插图

类似的讨论也发生在Twitter上。如果你让AI生成一篇关于“生活在太空的熊”的维基页面， AI也会试着生成。
有人认为，不，AI需要判断出这个要求不合理。

文章插图

关键就在于，人们对图片和文字的要求是不一样的。
图片中的内容不合理，人们只会觉得有趣而接受。而文字的内容错了，那就不可接受。
LeCun则认为这种工具的用法应该是辅助驾驶，它不会帮你写好论文，只是帮你在过程中减轻认知负担。

文章插图

以谷歌为代表的AI大厂，近年来对大模型特别是生成式模型的发布非常谨慎，像是对话模型LaMDA和AI绘画Imagen等都不开源、不给Demo或只给限定场景下的Demo 。
另一方面，以Stable Diffusion为代表开源项目推动了整个领域的技术进步与应用普及，但也在版权和生成有害内容方面引发一些问题。
你更支持哪种做法？或者还有第三条路么？
Galactica：
https://galactica.org/
参考链接：
[1]https://news.ycombinator.com/item?id=33611265
[2]https://twitter.com/Michael_J_Black/status/1593133746282106887
[3]https://twitter.com/paperswithcode/status/1592546933679476736