百川智能联合清华大学发布Baichuan-M4,医疗大模型幻觉率降至3.3
近日,百川智能与清华大学研究团队共同推出新一代医疗增强大模型Baichuan-M4。该模型在医疗垂直领域的多项核心评测中取得突破性进展。
多榜单登顶与核心数据
在HealthBench及其Hard、Professional三个专项榜单上,Baichuan-M4同时位列全球第一。其综合性能已全面超越GPT-5.5、Claude Opus 4.7与DeepSeek-V4-Pro。
模型在临床信息生成中的幻觉率降至3.3%。幻觉率指大模型输出非事实或虚构内容的概率,该数值直接对应模型在医疗诊断辅助中的准确性与临床安全边界。
技术演进与行业指向
百川智能方面明确,自M1迭代至M4,研发团队始终聚焦于跨越基础问答与临床诊疗之间的技术门槛。
这一路径表明医疗大模型的开发重心已从单纯的知识储备,转向复杂病情推演与方案生成。核心能力的跃升将直接优化垂直场景下的辅助决策效率。
从M1到M4,百川始终在做同一件事:让模型跨过“会答题”与“会看病”之间那道最难的坎。
(百川方面)
