共计 1763 个字符,预计需要花费 5 分钟才能阅读完成。
? GPT-4-32K 即将推出
GPT-4-32k 似乎很快就会到来。
? ChatGPT 由这些承包商提供支持,每小时 15 美元
NBC 新闻文章深入探讨了 OpenAI 的 ChatGPT 背后的影子劳动力的作用。这支队伍由负责完善和维护 AI 系统的承包商组成。本文阐明了 ChatGPT 等 AI 模型的开发和运行所涉及的人类努力,因为承包商会审查和评估潜在的输出以训练 AI 模型。尽管是开发过程的重要组成部分,但与全职员工相比,这些承包商通常处于幕后,并且不太受认可。
?OpenAI 的监管问题才刚刚开始
The Verge 讨论了 OpenAI 在遵守欧盟针对 ChatGPT 的通用数据保护条例 (GDPR) 方面面临的挑战。意大利数据保护局最近质疑在 GDPR 下使用 AI 生成的内容,导致人们担心 AI 公司应该如何在欧盟市场开展业务。文章强调了平衡 AI 创新与确保用户隐私和数据保护的重要性,因为 GDPR 合规性对于在欧盟运营的公司变得越来越重要。
?将《了不起的盖茨比》融入上下文
语言模型将文本查询作为输入和输出文本响应。查询和输出的长度称为上下文。语言模型的上下文长度有限(ChatGPT 是 8k 个“单词”)。随着最近一些很酷的算法变化,MosaicML 发布了一个可以用 65k“单词”操作的模型。这足以将整部小说《了不起的盖茨比》放在上下文中,并让模特写出尾声。
? Google 正在添加 AI,使搜索更加风度翩翩
Google 正在改变其呈现搜索结果的方式,以结合与 AI 的对话,以及更多的短视频和社交媒体帖子,这与网站结果列表背道而驰,而网站结果列表使其成为几十年来占主导地位的搜索引擎。
? AI 聊天助手可以改善有关分歧话题的对话
我们生活在一个有点分裂的世界,很难在促进理解的地方进行有意义的对话。有趣的是,如果你有一个 AI 聊天机器人关于困难话题的中间对话 – 双方都报告结果和理解有所改善。
? ZipIT,合并针对不同任务训练的模型
假设我们有两个不同模型的相同架构在不同的任务上训练。是否可以将它们合并到一个在两个任务上都运行良好的模型中? 当前的方法 (如重新盆栽或模型汤) 不起作用,因为存在不同的任务特定功能。这项新工作提出了两步过程的前进方向,比以前的算法提高了 60%。
?文本到 3D 与 shap-e
OpenAI 一直在悄悄地研究文本到 3D,有几个版本。这项新工作是该研究领域的有趣补充。它在标准对象或具有一些构图思想的对象中工作得很好。该模型还可以从 2D 图像创建 3D 对象,尽管这似乎不太有效。
?HiPool:使用图形神经网络对长文档进行建模
对于自然语言处理 (NLP) 模型来说,对长文本块进行编码是一项艰巨的任务。这项研究通过使用图形和新的注意力机制来改进该过程,这有助于模型理解句子之间的关系并在较长的序列上表现得更好。
?提高 AI 常识理解
今天的语言模型在常识知识方面仍然会犯愚蠢的错误。VERA 是一种新模型,它根据常识估计陈述的合理性,有助于过滤掉不正确的信息并提高现实世界环境中的性能。
? Otter:具有上下文指令调优的多模态模型
这项研究引入了一种称为 MIMIC-IT 的新方法,用于改善像 Otter 这样的模型在不同情况下理解和遵循指令的方式,包括图像和文本。通过使这些模型更易于访问,研究人员可以更轻松地使用它们来创建更好的 AI 系统。
?Kadoa
Kadoa 使用 AI 来探索、提取和转换 Web 数据。节省创建和维护网络爬虫的时间。使用 Kadoa 轻松提取您需要的数据。
? 迈向生物学基础模型
大型预训练模型在文本中令人兴奋,我们可以为生物学中的单细胞任务构建一个模型吗?scGPT 是一种擅长不同生物学相关任务的变压器。它是开放的,您可以下载重量。
? AI 最大的风险是控制它们的公司
Fast Company 的文章采访了领先的 AI 研究员兼 AI Now Institute 的创始人 Meredith Whittaker。惠特克强调,AI 的真正风险不是来自意识或超级智能,而是来自控制这些技术的公司。她认为,AI 深深植根于社会和经济体系中,因此,其影响在很大程度上取决于开发和部署 AI 的公司的动机和优先事项。文章强调了考虑 AI 运作的权力动态和社会政治背景的重要性,以便理解和减轻潜在风险。
? AI 非常擅长设计 mRNA 疫苗
优化 mRNA 疫苗中发现的基因序列的 AI 工具可以帮助制造具有更高效力和稳定性的疫苗,可以在全球范围内部署。