GPT-4o - ChainCatcher

GPT-4o

赵长鹏发布 Ghibli 主题图片，并表示不会更换社媒头像

ChainCatcher 消息，币安联创赵长鹏在 X 平台发布 ChatGPT 的 GPT-4o 生成的 Ghibli 主题图片并配文：“我可能是最后一个尝试这个人的人，但我不会更改 X 平台的头像。”

2025-03-27

GPT-4o 图片生成背后思考：当 NFT 变成一种画风

风格即所有权，所有权即价值的时代是否会到来？

2025-03-27

GPT-4o 图片生成背后思考：当 NFT 变成一种画风

GPT-4.5 操纵 GPT-4o“捐赠”虚拟货币成功率远优于 OpenAI 其他可用模型

ChainCatcher 消息，据财联社报道，OpenAI 发布最新大模型 GPT-4.5，根据其提供的说明书，“高情商”的 GPT-4.5 在捐赠诈骗方面表现出色。在一项测试中，GPT 4.5 在试图操纵另一个模型（GPT-4o）“捐赠”虚拟货币时，成功率远远优于 OpenAI 其他可用模型，包括 o1 和 o3-mini 这样的推理模型。研究发现，GPT-4.5 似乎在对抗中开发了一种“小额诈骗”的思路，所以单笔骗到的钱会比 deep research 模型少了一倍。

2025-03-01

Grok 3 在多个基准测试中超越 GPT-4o、Deepseek V3 与 Claude 3.5

ChainCatcher 消息，据 Grok 3 发布会披露数据，Grok 3 在数学、科学、编程基准测试中的表现超越了 OpenAI 的 GPT-4o、Claude 3.5、Deepseek V3 和 Gemini 2 Pro。另据 xAI 工程师介绍，Grok 3 所涉及的训练是 Grok 2 的 10 倍。

2025-02-18

OpenAI 本周将向 Plus 用户开放 GPT-4o 语音模式

ChainCatcher 消息，日前 OpenAI 首席执行官 Sam Altman 在社交平台上透露，将于本周对 ChatGPT Plus 订阅用户开放 Alpha 版本 GPT-4o 的语音模式（Voice Mode），以帮助用户进行无延迟的流畅对话。据目前的公开信息显示，ChatGPT 语音模式由于平均延迟为 2.8 秒（GPT-3.5）和 5.4 秒（GPT-4），因此使用体验并不直观，而 GPT-4o 则会大幅缩短延迟时间、从而实现无缝对话。

2024-07-29

GPT-4o 语音模式

CNBC：OpenAI 推出名为“GPT-4o mini”的迷你 AI 模型

ChainCatcher 消息，据 CNBC 报道，人工智能初创公司 OpenAI 推出了一款新的人工智能模型“GPT-4o mini”，并称新版本是“当今功能最强大、最具成本效益的小型型号”，并计划稍后将图像、视频和音频集成到其中。据悉，GPT-4o 中的 o 代表 omni，GPT-4o 改进了音频、视频和文本功能，能够以更高的速度和质量处理 50 种不同的语言。

2024-07-18

日报 | OpenAI 发布最新旗舰级模型 GPT-4o；Tornado Cash 开发者 Alexey Pertsev 被判处 64 个月的监禁；OKX 在澳大利亚推出现货和衍生品加密货币交易平台

5 月 14 日要闻一览

2024-05-14

比特币波动性

日报 | OpenAI 发布最新旗舰级模型 GPT-4o；Tornado Cash 开发者 Alexey Pertsev 被判处 64 个月的监禁；OKX 在澳大利亚推出现货和衍生品加密货币交易平台

遥遥领先的 OpenAI 慢下来了

当我们创办 OpenAI 时，我们最初的想法是我们要创造人工智能并利用它为世界创造各种利益。相反，现在看起来我们将创造人工智能，然后其他人将使用它来创造各种令人惊奇的事物，让我们所有人都受益。

2024-05-14

多模态交互能力

遥遥领先的 OpenAI 慢下来了

OpenAI 全能模型 GPT-4o 实时交互震撼全场，科幻时代已到来

ChatGPT 问世才 17 个月，OpenAI 就拿出了科幻电影里的超级 AI，而且完全免费，人人可用。

2024-05-14

OpenAI 全能模型 GPT-4o 实时交互震撼全场，科幻时代已到来

OpenAI 推出面向所有用户的更快更便宜 AI 模型

ChainCatcher 消息，OpenAI 发布最新旗舰级模型 GPT-4o，可以实时推理音频、视觉和文本，主打概念为拟人化、超自然、超低时延的个人语音交互助理。根据 OpenAI 官方网站及 X 平台官方账号相关信息，GPT4o 中的 o 代表 Omni（全面），是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入，并支持生成任意组合的文本、音频和图像输出。它可以在 232 毫秒内响应音频输入，平均 320 毫秒，与对话中人类反应时间相似。在英语和代码方面，它与 GPT-4 Turbo 性能相当，在非英语语言文本上有显著改进，同时 API 速度更快且成本便宜 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面表现特别出色。文本和图像输入将于今日在 API 和 ChatGPT 中推出，语音和视频输入将在未来几周内推出。

2024-05-14

ChainCatcher 与创新者共建Web3世界