TAG:OCR技术

NotebookLM新增图像识别功能 实现板书内容结构化检索

NotebookLM新增图像识别功能 实现板书内容结构化检索

谷歌NotebookLM最新升级支持图像导入功能,可将黑板板书、教科书扫描页等图像通过OCR和语义解析转化为可检索知识库。用户可直接用自然语言查询图中内容,系统能自动识别手写与印刷区域、提取表格结构,并与现有笔记关联。该功能面向全平台免费开放,未来将增加本地处理选项以保护敏感数据,教育领域上传量在48小时内激增340%。

2025-11-17 11:48
0
0

文心4.5最强衍生模型发布 PaddleOCR-VL登顶OCR综合性能全球第一

文心4.5最强衍生模型发布 PaddleOCR-VL登顶OCR综合性能全球第一

百度正式发布并开源多模态文档解析模型PaddleOCR-VL,该模型在全球权威评测OmniBenchDoc V1.5中以92.6分取得综合性能全球第一,超越GPT-4o、Gemini-2.5 Pro等主流模型。模型参数仅0.9B,轻量高效,支持109种语言,精准识别文本、表格、公式等复杂元素,推理速度较同类模型提升显著,适用于政企文档管理、知识检索等多种智能任务。

2025-10-17 11:08
11
0