社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  chatgpt

ChatGPT又变强了,OpenAI会变成下一个苹果吗?

虎嗅APP • 6 月前 • 76 次点击  


出品|虎嗅科技组
作者|齐健
编辑|王一鹏
头图|OpenAI

“今天,有大约200万开发者在使用我们的API进行各种用例的开发。超过92%的财富500强公司正在使用我们的产品进行构建,而现在ChatGPT每周活跃用户大约有1亿。”

北京时间11月7日凌晨,在OpenAI的首次开发者大会上,Sam Altman公布了过去一年中OpenAI的骄人成绩。

如会前流传的消息,本次大会上推出了ChatGPT的最新版本GPT-4 Turbo,以及众多全新功能。更重要的是,OpenAI宣布要围绕GPT打造AI平台,推出GPT Store,并提出了GPTs的概念,用户可以利用GPT Builder工具,创建自己的GPT。

从ChatGPT被比喻为AI的iPhone时刻,恐怕Sam Altman就已经把目标瞄准了苹果。不过,他的野心更大,不仅要把ChatGPT做成下一个iOS,还要进一步加强与用户的绑定,让每个用户都有机会成为开发者。

王炸:GPT-4 Turbo

本次发布的LLM(大语言模型)更新主要包括:

  • 最新的GPT-4 Turbo,支持128k上下文窗口,且价格更低,输出更快。

  • 全新的Assistants API,使开发人员更容易构建自己的人工智能应用程序。

  • 新的多模态功能,包括视觉、图像创建(DALL·E 3)和文本转语音(TTS)。



OpenAI开发者大会的发布的重要更新

长上下文

长上下文正在成为百模大战的“主战场”。对比众多新模型,GPT-4的32k token上下文窗口已不那么出色。此次GPT-4 Turbo更新的上下文窗口达到128k,是GPT-4的四倍,且超过了竞对Anthropic此前推出的100k token的Claude 2。

Sam Altman在演示中称128k token大约相当于300页纸的文字量,英国版的《哈利·波特与魔法石》差不多就是300页,指环王三部曲平均每本是400页。

不过,GPT-4 Turbo的上下文长度也并非最长。一周前,百川智能发布的Baichuan2-192K,上下文窗口长度为192K,能够处理约35万个汉字。

开发助手

OpenAI此次更新中,着重面向开发者推出了Assistant API,使开发者能在应用中集成类似代理的AI体验。

这个API允许AI助手执行具体任务,调用模型和工具,并处理一些复杂的编程和数据处理工作。它支持多种用途,如自然语言数据分析、编码辅助、旅行规划等。

助手API具有持久化线程功能,简化了状态管理,并允许调用开发者定义的函数。此外,它还提供了代码解释器和检索工具,可在外部数据上运行和检索信息。数据保护方面,开发者可自主管理其传递给API的数据。现在,开发者可以通过助手API游乐场,无需编码进行测试。

此外,OpenAI对函数调用进行了更新,现在模型可以在单个消息中调用多个函数,并更准确地返回正确的函数参数。GPT-4 Turbo在遵循指令生成特定格式时表现更佳,并支持新的JSON模式以确保输出有效的JSON对象。新增的API参数response_format允许模型输出语法正确的JSON。此外,通过新的seed参数,模型可以产生可重现的输出,有助于调试和编写单元测试。OpenAI还计划推出返回输出令牌对数概率的功能,以便在构建“自动完成”等功能时使用。

知识更新

GPT-4的知识库更新到2023年4月。目前ChatGPT中使用的GPT-4模型,已经将知识库更新到了2023年4月,不过GPT-3.5的知识库仍然停留在2022年1月。

新的多模态模型

在多模态能力方面,GPT-4 Turbo的API将集成DALL-E3,以及文生语音模型TTS(text-to-speech)。

开发者可以通过API直接调用GPT-4 Turbo with vision中的DALL-E3模型,进行图片识别和图片生成。事实上,DALL·E 3上线之后,ChatGPT Plus用户就已经可以在GPT-4模块下调用DALL·E 3进行图片创作,以及多模态的图片识别了。不过,这次是以API的形式,将多模态的能力开放给开发者。

此外,OpenAI还上线了新的TTS文生语音功能。类似能力,在ChatGPT手机端也已经上线了一段时间(不过目前实测中文还是有一点英语口语),此次也是针对开发者的API开放。目前TTS的语音包共有六种声音可选,可以输出Opus、AAC和FLAC三种格式,尚不支持自建声音。

价格更低,输出更快

“在模型持续的迭代中,我们的价格也在不断下降。”Sam Altman介绍说,相比于GPT-4,GPT-4 Turbo的输入价格只有1/3,0.01美元每1000 token;输出价格为0.03美元每 1000 token,只有原来的1/2。而内容生成的速度,提高了2倍。

又一个iPhone时刻:GPT Store

在ChatGPT插件上线的时候,就有很多人将其比喻为安卓市场或是iOS的App Store。如今,OpenAI真的推出了AI版本的App Store——GPT Store。

用户可以直接创建ChatGPT的自定义版本,在开发者大会现场,两位OpenAI工作人员现场演示了GPT的构建方法。

OpenAI工作人员Jessica shay现场演示了利用GPT Builder构建一个能与行程表互动的 GPTs。并以对话的形式命令 GPT 给 Sam Altman 发信息, Altman也在现场接收到了这条信息。

另一个更加专业的演示则是OpenAI 的工作人员现场演示Assistants API的用法:它不仅能列出巴黎旅游建议,还能在地图上将计划中提到的地点按类别标记出来。

Sam Altman表示OpenAI 将会在本月底上线 GPT Store,开发者可以通过GPT Store分享、发布自己的 GPTs。此外,GPT Store产生的收入OpenAI也将按一定比例与开发者分成,不过具体的分配方案还尚未公开。

关于钱和微软

在现场的Assistants API演示过程中,OpenAI工作人员开放了一个现场抽奖,第一波抽奖是随机选了5个到场工程师每人发了500美元的开发者额度。第二波则直接给到场的900多名软件开发人员及参会嘉宾每人发了500美元额度。

看似“撒币”的行为,其实对于OpenAI来说,也没有特别大方,因为API额度消耗的速度对于正常开发者来说,实在是太快了。多位开发者曾在OpenAI社区中表达了OpenAI发放的120美元的开发者试用优惠额度很快就会用光。


开发者zolika84在测试语音识别whisper-api时,90分钟就用掉了120美元额度

过去半年中,OpenAI的估值水涨船高,总融资超过140亿美元,但OpenAI的资金消耗速度惊人。

一方面,OpenAI需要支付大量的算力和研发成本;另一方面,还要为未来不确定的法律问题做准备。

本次大会,OpenAI推出了copyright shield功能,用于保护用户不受到版权问题困扰,不光从技术上规避版权风险,当用户遇到版权问题时OpenAI也会协助解决。

过去几个月中,OpenAI一直被美国的众多版权所有者联合维权,多家出版集团都在向OpenAI伸手要钱。在版权问题方面,未来的商业化推广道路需要有庞大的资金支持。在美国的法律环境下,要推出这样一项服务,OpenAI大概率也已经盘算好了败诉后的退路。

说到钱,就不得不提到OpenAI一直以来的大金主:微软。坊间一直流传着两家不合的传闻。Sam Altman的演讲中,只邀请了微软CEO Satya Nadella一个嘉宾,似乎是在向外界证明OpenAI和微软的无间合作。

在演讲中,Sam Altman直白地问Satya Nadella:微软和OpenAI的合作关系怎么样?

Satya Nadella幽默地回答说:“事实上,我记得你第一次向我伸出手时说,‘嘿,你有一些 Azure 积分吗’,比起那时,我们已经取得了很大的进步。”

微软始终是基础设施提供者,赚的是基础设施的钱。Satya Nadella反复强调:“我们的首要任务是构建最好的系统,以便你可以构建最好的模型,然后将其全部提供给开发人员。”

不过,Satya Nadella并没有否认微软开发团队在AI方面的研究工作,他表示:“我们自己也是开发者,我们也在构建产品。”

如对本稿件有异议或投诉,请联系tougao@huxiu.com

End


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/164044
 
76 次点击