10月17日音书,HuggingFace官网涌现,百度昨晚发布的自研多模态文档领略模子PaddleOCR-VL,发布20小时内即登顶HuggingFace Trending环球第一。
据了解,该模子中枢参数仅0.9B,轻量高效,能以极低斟酌支拨精确识别文本、手写汉字、表格、公式、图表等复杂元素,撑合手109种说念话。在巨擘榜单OmniBenchDoc V1.5中,它以92.6分获空洞性能环球第一,四大中枢才调全线SOTA,越过GPT-4o等模子,刷新OCR VL模子性能记载。
当作文心4.5繁衍模子,PaddleOCR-VL交融了NaViT动态分歧率视觉编码器与ERNIE-4.5-0.3B说念话模子,完毕精度与为止双冲破。