<汇港通讯> 智谱(02513)正式发布并开源GLM-OCR。
智谱表示,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署。在文本、公式、表格识别及讯息抽取四大细分领域的表现优於多款OCR专项模型,性能接近谷歌(Google)旗舰大模型Gemini 3 Pro。在实际应用中,GLM-OCR能够精准解析扫描件、PDF、表格及票据,有效解决手写、印章、竖排及多语言混排难题。
该公司称,未来将持续迭代GLM-OCR,推出更多尺寸版本,并将能力延伸至更多语言和视频OCR,全面拓宽视觉智能的应用边界。
#智谱 (CW)
新闻来源 (不包括新闻图片): 汇港资讯