ChatGPT界面大更新,开始卷应用了?这次想灭谁?www.kmfcw.com

2024-10-04 11:03:47 来源:

调整长度:将文档长度扩充或精简。

更改阅读水平:调整阅读水平,范围涵盖从幼儿园、中学、大学到研究生。

最终润色:全面检查语法、清晰度和一致性。

添加emoji:添加相关表情符号以增强趣味色彩。

例如以下视频中,用户先上传笔记至生成博客内容,再为第一段添加举例让表述更丰富和润色题目,最后调至“大学阅读水平”。不到一分钟,粗略零散的笔记就变成了一篇完整的结构化博客文章。

硅星人也浅试了一下,在里让GPT写一篇介绍本周新闻的文章,然后翻译为中文。可以看到中文稿直接覆盖原英文生成,而不是以问答形式另起对话。

进一步用“建议编辑”补充内容后,分别生成“ ”和“”版本来对比看看差异。

除了AI智能改进之外,还能直接在原文调整字体加粗、斜体、字号等格式。

简单来说,拓展了一种与的全新交互方式。集成多种工具,让用户在聊天和文档编辑之间无缝转换,轻松将对话中的想法变为成熟的最终版本。在一个平台完成全套写作过程,有效避免了工作流的中断。

用编程

与写作类似,编程也是一个需要反复迭代的过程,且对逻辑的严密性有更高的要求。为了帮助开发者更高效完成代码编写和调试, 也配备了一些相关的便捷功能,包括:

代码审查:提供编建议,供用户批准或拒绝,帮助优化代码质量。

添加logs:插入print日志输出,帮助开发者跟踪程序运行情况,方便调试。

添加:为代码添加注释,便于理解代码。

修复错误:自动检测并修复代码中的问题,减少调试时间。

代码移植:将现有代码转换为不同编程语言,如、、Java等,便于跨语言开发。

下面的demo展示了在界面生成Rust语言的API Web服务器,并进行代码优化和全局审查的过程。

使用o1-输出的合成数据特别训练

对集成的GPT-4o进行了专门训练,使其能够在创作过程中担任更积极的协作者角色,并且具备更好的上下文感知能力。

为此,研究团队开发了“在写作和编程任务中自动触发画布、生成多样化内容类型、执行有针对性的编辑、重写文档、提供内嵌批注与建议”等核心功能。

训练方法上,应用了他们一直强调的合成数据生成技术,从o1-模型中提取输出,帮助GPT-4o针对目标功能进行后期训练。这一方法使能够快速提升写作质量,并适应新的用户交互模式,无需依赖人工生成的数据。

(如果担心自己上传的内容被用于模型训练,记得到用户设置里关闭“数据共享”选项。)

集成模型评估

为了评估模型表现,进行了超过20项内部自动化测试。

其中一个关键挑战是定义何时触发功能。研究团队教会模型在处理复杂写作任务时正确触发画布,比如“撰写博客文章”,而避免在类似“帮我做一道晚餐食谱”这样的简单问答中过度触发。经过优化后,GPT-4o在写作任务中的正确触发率达到83%,编程任务的正确率更高,达到了94%。

第二个挑战是模型在被触发后的编辑行为。比如在用户明确选择特定文本时进行有针对性的编辑( edit),其他情况下则倾向于重写()。结果显示,特别训练后的GPT-4o在针对性编辑上的准确率比基线模型提高了18%。

团队还通过人工评估验证了模型生成高质量评论的能力。相比零样本提示的GPT-4o,集成的模型在评论准确性上提升30%,在评论质量上提升16%。

开始卷应用

可用性方面,测试版已对Plus和Team用户开放,下周起扩展至教育及企业用户,最终会让所有用户都能免费访问。

表示,目前仍处于早期阶段,但他们计划迅速提升其功能。对于那些需要频繁编辑和修改的复杂任务,让成为传统聊天界面的有力补充,实现“更自然”的人机协作愿景。

并不算掀起的全新交互模式,也离最理想的AI与人类交互形态还很远。而且,在身上,用户能看到很多对手已经做出来的产品形态的影子。它就像的工具及AI代码编辑器等明星应用产品功能的大杂烩,然后在这些基础上做了一些细节的升级。

很明显,卷应用是新的发力方向。此前其实在应用的交互体验和细节设计上都有些迟缓,这家公司在GPT模型依然能保持领先的阶段,并没有体现出对产品的重视。现在模型能力的格局已经完全不同,不仅差距缩小,而且当前多家大模型和消费级AI提供商都将可编辑工作空间作为生成式AI的最新突破点。

除了上面提到的几款应用,此前谷歌不仅将集成到Docs,它的近期创新的AI播客功能也大受好评,现在也加入了进来。

随着大量资金仍在流向硅谷的AI公司,消费者在未来一年内可以期待更多基于现有工具的结构性实验新品推出。只不过这个过程里,变得更像一个追随者,而非引领者了。

  • 标签:
相关阅读
热门标签