10月20日,DeepSeek上传了一篇名为《DeepSeek-OCR:Contexts Optical Compression》的论文。
论文提到,通过“把长文本内容渲染成一张图片,再让模型去”看”这张图,从而实现对文本信息的压缩。”显著减少计算和存储开销。
文中介绍,在实验中,DeepSeek-OCR的表现优异。压缩比为10倍时,OCR精度可达97%;20倍压缩时仍有60%精度。这些结果表明,模型在压缩文本的同时仍能保持相对高的准确性,尤其是在处理长文档时,效果尤为突出。
据华创证券,光学字符识别(OCR)技术是指通过电子设备(如扫描仪或数码相机)识别纸质文档中的字符并将其转换为计算机可处理的文本格式的过程,被广泛应用于文档数字化、信息检索和数据分析等领域。
近年来,OCR技术与人工智能的结合成为新的发展趋势。通过深度学习和神经网络模型的应用,OCR系统在复杂场景下的识别精度得到显著提升。目前,基于深度学习的OCR已成为行业主流,未来的发展方向包括一体化的端到端模型、高效轻量化模型,以及向更高智能化的OCR发展,实现从“感知”到“认知”的跃升。
另外,据YHResearch预计,2024年全球人工智能驱动的OCR市场规模约81.7亿元,到2031年市场规模将接近136.9亿元。
相关公司中,合合信息:公司扫描全能王产品是业内标杆性产品,产品OCR识别率显著领先市场同类产品。在复杂场景下(如多语言、多版式、多曲面等),公司的平均字符识别率为81.9%,领先于百度的70.0%、腾讯的65.0%和阿里的66.9%。业务涵盖识别性能、AI核心能力、数据安全性和可靠性。
汉王科技:公司的OCR技术曾经获得国家科学技术进步二等奖,在手写体识别、满文识别、藏文识别、复杂场景、复杂版面识别等技术优势突出。
原创文章,作者:阴阳无极,如若转载,请注明出处:https://www.accstt.com/archives/138320.html 以及“阴阳无极精准规则化交易系统”
转载说明:转载或引用本网内容必须以新闻性或资料性等公共信息为使用目的,不能用于赢利目的。不得对本网内容原意进行曲解和篡改。转载本网内容亦不得损害本网或他人利益,不得进行任何违法活动。对于不当转载或引用本网内容而引起的法律诉讼或任何其他形式的纠纷,阴阳无极
注明:在使用本网原创内容时必须注明“来源: 阴阳无极精准规则化交易系统 ”或“ 阴阳无极精准量化交易系统 ”及文章来源出处。


