先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
最近做了一个重要的决定,将我的ChatGPT Plus会员升级到了Pro会员。今天,我就来跟大家分享一下Pro会员使用o1 Pro模式在编程中的强大应用,以及我的实际使用体验。
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
相信大家对o1都不陌生了,在之前的视频里,我就评测过o1和Claude,当时就发现o1的写作能力突飞猛进,图片识别能力也相当出色。
最近OpenAI官方博文也指出,o1 Pro模型在数学、编码以及高水平科学问题方面,表现比o1更胜一筹。
为什么选择Pro会员?
那么,Pro会员相比Plus会员有哪些优势呢?
无限制使用o1 Pro Mode: 这是最吸引我的地方!Pro会员可以无限次使用o1 Pro Mode,尽情享受它带来的高效编程体验。 更高级的语音功能: Pro会员的高级语音功能中,视频和屏幕共享的限额更高(虽然GPT没说具体限额),语音方面则不限制访问,这对我来说非常实用。 Sora模型不限使用,但有不少博主反馈不如Kling、海螺。 更长的上下文长度: 这是Pro会员的另一大杀手锏!之前o1的上下文长度是128K,输出是32K。而今天OpenAI更新了o1 API,上下文长度达到了惊人的200K,输出也提升到了100K!虽然目前还不确定GPT里是否也同步更新,但对比Plus会员的32K上下文长度,Pro会员的优势显而易见。这意味着你可以把更多代码一次性发送给它,让它帮你编辑或修改,它也能反馈给你更完整的代码内容。
如果你的Plus会员还剩15天,升级到Pro会员只需要支付15天的Pro会员价格,系统还会扣除之前Plus会员剩余天数的费用(例如10美元),最终需要支付90美元。
我个人非常喜欢ChatGPT的高级语音功能,尤其是它的视频和屏幕共享功能。之前我在视频里演示过,当时用的是旧的音色,后来有网友提醒我,用新的语音角色可以避免它经常提醒我“由于政策限制,无法告知某些事情”。换成新语音后,我在浏览网页或阅读论文时,遇到任何问题都可以直接问GPT,它就像一个博学且反应迅速的助手,语音质量也很棒。
o1 Pro实战演示:三个网页项目
接下来,我给大家展示三个用o1 Pro模式开发的简单网页项目,都是基于HTML的。
我经常让不同的AI编程工具完成同一个任务,例如“AI发展史”页面。这次o1 Pro生成的页面导航清晰,但界面美观度我个人觉得一般,即使我让它优化,它似乎也get不到我要的点。不过,它在最后添加了一个“作者”的链接,指向了我的GitHub,这让我很惊喜!在“展望未来”板块,它还链接到了谷歌和OpenAI的官网,这些都是真实有效的链接,说明它超出了我的预期。
第二个项目是一个类似“贪吃蛇”但更简单的“碰碰球”游戏。o1 Pro生成的页面UI依然有待改进,但左侧的操作说明、字体样式以及收集进度都是它自己添加的,包括得分后面的数字“5”的字体,我都觉得设计得不错。
第三个项目是一个“太空射击”游戏,它完全通过SVG实现,没有调用外部图片,喷火效果也相当不错。
o1 Pro + IDE = 高效开发新模式
现在的编程工具发展迅速,无论是Cursor、Windsurf还是我多次介绍的Claude MCP,都能轻松实现多文档编辑修改。但当我们想用o1 Pro Mode时,会遇到一个问题:它在GPT对话框里,和我们的IDE是分开的,如何快速融合它们呢?
这里有两个方法:
OpenAI官方集成方案(11月视频介绍过): OpenAI提供了一个插件,可以集成到Xcode、VSCode,后来也支持了Windsurf和Cursor。安装插件后,你可以在IDE中打开多个项目文件,插件会自动获取这些文件的全部代码(无论屏幕上是否显示完整),然后你就可以让它根据这些代码进行编辑或修改。 McKay Wrigley提出的方案: McKay是ChatBot UI的作者,他提出了一个更灵活的方案,结合了RepoPrompt和o1-xml-parser这两个工具。
RepoPrompt使用步骤:
从官网下载RepoPrompt并安装。 加载你的目标项目文件夹。 选择需要让GPT参考或编辑的文件。 填写你希望对项目进行的更改或添加的功能。 在右侧的提升词中,可以选择一些预设的提示词,例如“你是一个高级软件工程师”。 点击“Copy”,可以选择是否包含已保存的提示词、文件和用户指令,然后复制生成的指令。
o1-xml-parser使用步骤:
从McKay的GitHub仓库下载并安装o1-xml-parser。 打开o1-xml-parser项目,在上方填写你的项目目录,下方粘贴从o1 Pro获取的XML内容。 点击“应用”,它会自动将o1 Pro的回复应用到你的项目中。
注意: RepoPrompt和o1-xml-parser的更多功能可以参考它们的官方文档,这里只介绍了与视频相关的部分。
o1 Pro + Claude + Grok:智能儿童安全意识提升平台开发实例
最后,我用一个实际项目来演示如何结合o1 Pro、Claude MCP以及Grok API进行高效开发。
我做了一个“智能儿童安全意识提升平台”,它可以连接Grok API(Grok最近推出了新的模型,官方数据显示各项指标都很不错,而且有免费额度)。上传图片后,它能分析图片内容并给出安全提示。左上角的logo是用Recraft生成的,效果很不错。
例如,上传一张儿童房间的图片,它会识别出“火灾与高温风险”,点击“查看相关安全教育视频”,会链接到YouTube。我尝试过直接在界面链接YouTube API,但发现提示词和界面描述的匹配度太低,所以最终选择了关键词搜索。
点击不同的风险卡片,左侧会显示风险在图片中的位置,但准确率还有待提高。
开发流程:
需求构思: 我在ChatGPT里跟o1 Pro沟通,让它帮我想一个有意思的NextJS演示项目,并给出了许多想法。最终,我选择了“智能儿童安全意识提升平台”,并让它生成了一个极简产品需求文档,还帮我起了个英文名。 项目生成: 我在Claude里,用MCP让它在本地目录生成项目,并调用工具编写代码。我把产品文档和Grok API文档都发给了它,Claude MCP帮我完成了项目搭建。 UI优化: 我让o1 Pro根据截图提出UI和交互建议,然后将好的建议反馈给Claude MCP,让它执行。由于Claude MCP的输出Token有限,需要多次让它“继续”,而o1 Pro的输出Token更充足,一次可以处理更多代码。 功能完善: 我没有用RepoPrompt和o1-xml-parser,而是直接将界面图片发给o1 Pro,让它思考和改进。可以看到它的输出内容非常多,一次回复就能包含很多信息。
如果没有大模型的帮助,我可能无法想到这么多好的点子。而有了大模型,我们可以和它沟通,获得许多灵感。例如,o1 Pro帮我完善了标签和图标,建议我链接安全教育视频,这些都是非常棒的想法。
总结
我非常喜欢Notebook LM这款产品,但有了ChatGPT的高级语音功能,我们完全可以拥有自己的“播客”!因为我们可以直接让GPT解释任何APP或网页内容,而不用像以前那样先OCR识别再让大模型解释,节省了大量时间。
Notebook LM最近才推出,可以参与播客对话,而ChatGPT的高级语音功能可以随时随地互动,效率更高。虽然Notebook LM目前只能输出英文,而Gemini 2.0 Flash能听懂中文但回复是英文或其他语言,在这一点上,ChatGPT的高级语音功能非常值得使用。