今天,OpenAI发布了其最新模型GPT-4.5 。该功能现已在Box AI Studio中推出。 GPT-4.5是OpenAI推出的突破性新模型,代表了编码、数学、推理能力等方面的重大进步。这使得准确性和完整性对于关键任务企业用例尤其有价值。
与 OpenAI 之前的版本一样,GPT-4.5 证明自己是最好的模型之一,无论是在我们的评估分数上,还是在处理我们遇到的许多最困难的人工智能问题的能力上。虽然 GPT-4.5 不是像 OpenAI o3-mini 那样的思维链式推理模型,但它确实对各种主题提供了良好的理解和推理。
目录
Box 对该模型的初步测试
使用 GPT-4.5 从非结构化数据中提取更多价值
利用 GPT-4.5 解锁更深入的见解
让 Box AI 和 GPT-4.5 为您的整个组织服务
内容分析的下一步就在这里
Box 对该模型的初步测试
在我们的企业文档问答评估集上, GPT-4.5的准确率比GPT-4o提高了4 个百分点。
GPT-4.5在涉及数学计算的问题上胜过了许多以前的非链式模型(例如,有关财务文件的问题,当没有提供确切的数字时,模型必须进行推断和计算以从数据中得出准确的毛利率)。
在需要用户对事实进行分组和筛选并回答相关问题的问题上, GPT-4.5的表现优于GPT-4o 。
GPT-4.5尤其擅长数学和日期计算,而旧模型则难以完成这些任务。
使用 GPT-4.5 从非结构化数据中提取更多价值
为了进一步探索GPT-4.5的功能,我们专注于一个我们预计它将对企业产生重大影响的关键领域:从企业内容中提取结构化数据或元数据。从非结构化内容中识别和提取结构化信息的能力是一项将深刻改变人们工作方式的进步,它能够实现更强大、更自动化、更适用于所有员工的工作流程。在
Box,我们使用多个企业级数据集严格评估我们的数据提取模型。我们利用的关键数据集之一是CUAD,它包含510多份商业法律协议。在这个数据集中,Box确定了20,000 个可以从非结构化内容中提取的字段,并根据这些字段的单次提取来评估模型(这是最困难的测试,因为它衡量模型是否有机会一次性提取所有元数据,而不是多次尝试)。我们的测试表明,GPT -4.5比GPT-4o多准确提取了19 个百分点的字段,证明了其处理细微合同数据的能力有所提高。为了验证GPT-4.5是否能够满足现实世界企业内容的需求,我们根据一组更严格的文档评估了它的性能:Box自己的挑战集。我们选择了一些复杂的法律协议,这些协议代表了客户面临的最具挑战性的情况:多模式内容(数据和文本)、高信息密度以及长度超过200页。在该挑战集中,GPT-4.5在关键字段提取准确率上持续超越GPT-4o,展现出处理复杂细致的法律文件的卓越能力。这些结果表明, GPT-4.5在企业文档理解和处理的几个关键领域比GPT-4o有了显著的改进。
1500x860-Box AI Enterprise Eval(所有文档的数据提取)
1500x860-Box AI Enterprise Eval(硬文档数据集)__2025_02_27T20_21_29_722Z (1)
利用 GPT-4.5 提取更深入的洞察
那么这对你来说意味着什么?说实话,由于信息量太大,很难仔细阅读这些文件。您无需花费数小时进行分析和比较,只需单击一下即可获得所需的关键事实,那会怎 电话号码库
样?利用GPT-4.5和Box AI ,我们能够在从文档中提取关键元素时获得更准确的见解。通过合成Box Hub中存储的文档,
GPT-4.5可以显著简化研究审查流程。使用GPT-4.5 ,研究人员可以:
快速摘要:立即掌握复杂研究文章的核心发现
关键数据提取:快速识别相关数据点、实验设置和结果
识别趋势:发现研究中的新模式和联系
方法论比较:轻松对比不同的研究方法及其局限性
整合信息:形成新假设的基础并加速研究进程,以促进更快的突破和更明智的科学探究
让 Box AI 和 GPT-4.5 为您的整个组织服务
GPT-4.5不仅仅是加快文献综述的速度和激发突破性发现。让我们看一些用例。
法律:想象一下需要立即识别冗长合同中隐藏的关键或特定条款。GPT-4.5帮助法律团队以无与伦比的速度和准确性分析文件,确保万无一失。
客户支持:客户支持团队可以使用GPT-4.5从客户文档和知识库中快速识别相关信息,从而更有效地解决查询。
销售:销售团队可以使用GPT-4.5自动生成合同的简明摘要,突出显示关键条款和潜在风险,从而节省宝贵的时间并提高交易成交率。
营销:营销团队可以使用GPT-4.5分析客户数据并自动生成有针对性的活动材料,以提高参与度和投资回报率。
内容分析的下一步就在这里
还记得需要立即找到所需信息的场景吗?借助GPT-4.5 , Box AI现在更快、更准确、更强大。请您亲自前来体验一下其中的不同之处。GPT-4.5从今天开始在Box AI中可用。
*本博客是20XX 年 XX 月 XX 日(日本时间 XX 月 XX 日)Box, Inc. 官方博客(https://blog.box.com/ )上一篇文章的翻译。 Box 平台产品营销主管
Vishal Naik
<相关内容>
内容+人工智能:智能工作流程和转型用户体验
推出企业高级计划:应用程序、自动化和人工智能的新时代