前言

熟悉我的小伙伴应该知道我在大学时期参与了很多竞赛,我向来对比赛是比较热枕的,以我个人观点,我认为可以通过竞赛激发学习激情和检验自己的技能水平掌握情况,大学生很少有机会能够了解到课堂之外市场的需求,外包服务竞赛就是一个很好的机会能够帮助大学生接触到市场需要何种服务以及人才需求,而且大学的很多比赛都可以积累自己的操行分,拿到一个好的名次收获颇多,可以说学业事业一箭双雕。正好这次第十四届中国大学生服务外包大赛圆满落幕,在我的大学竞赛生涯中曾也参见过此类比赛且获得过金奖,正好借此次机与大家一起细品中国大学生服务外包大赛。

比赛背景

中国大学生服务外包创新创业大赛(以下简称“大赛”),是响应国家关于鼓励服务外包产业发展、加强服务外包人才培养的相关战略举措与号召,举办的每年一届的全国性竞赛。服务外包是指将某些业务或工作过程外包给其他机构或公司来完成,在一定程度上降低企业的成本和提高效率。获得服务外包的比赛奖项,可以证明获奖者在团队合作、项目管理、沟通协调等方面具备较强的能力和经验,这对于未来就业和个人职业发展都是有帮助的。而且此类比赛一般来说在各大高校都是有保研加分的,自然关注的人比较多。

大赛自2010年创立以来,累计吸引了1600余所院校、50余万名大学生参加,成为服务外包产业领域的国家级赛事。本届大赛共有803所全国院校的8006支团队报名参赛,报名团队数再创新高。而且随着技术的不断迭代,市场需求也再不断更迭,大赛的竞赛主题也响应着时代的发展而诞生了很多贴切前沿技术主题的问题。比如就最近比较火热的AI大模型运用,这次大赛就很好的结合了当今热点技术话题,启发了更多参与比赛的大学生思考。

本次竞赛内容设计充分聚焦企业发展中所面临的技术、管理等现实问题,与产业的结合度更紧密,智能文字识别技术是大赛重点关注的技术之一。智能文字识别技术融合了智能图像处理、光学字符识别、深度学习、自然语言处理等技术,可在多语言、多版式、曲面、褶皱、背景干扰等复杂场景下进行文字信息的识别分析与理解,在生产、教育、生活等多个领域中有着广泛的应用。

合合信息在智能文字识别领域有着十余年深耕经验,基于自身在行业领域的认知,从“基于智能文字场景个人财务管理创新应用”等议题出发,向广大学生群体发出了“产品征集令”,得到了积极的反馈,相关赛题吸引了包括重庆大学、北京邮电大学、哈尔滨工业大学、华东理工大学、四川大学、西北大学等全国70多所高校的近300支队伍积极参与,也涌现出许多优秀的作品。

参赛作品评析

本次大赛中,诸多高校参赛队伍很好地洞悉了不同用户群体的痛点,例如从“中老年人使用记账本应用需要经历繁琐的操作”现象背后发现“图片识别记账方式更受欢迎”的趋势,并针对性地进行产品开发优化。

以中南大学的作品记账全能王—基于图像预处理和BERT模型的OCR账单识别系统项目为例。

项目设计方向

针对此需求,中南大学很好的理解了项目开发的疑难点。首先此类应用面对的是中老年人,那么开发左眼皮应该是适应中老年人的安卓手机APK比较合适。此外不需要设计更多繁杂的功能,只适合记账使用,应用应该操作简单明了,要容易快速上手,不要设计太多复杂的过程最好。传统记账一般都是手动输入或者是其他应用辅助进账,比较麻烦。而本次比赛借助合合信息智能图像识别模块可以快速进行小票识别,直接按照模版读取到对应框架内容中。因此如何结合智能图像识别模块以及设计对应简洁、高效的数据输入财务管理工具是项目的主要难题。

中南大学的作品采取的是SpringCloud微服务架构,Spring Cloud可以帮助开发者实现微服务架构的快速搭建和部署,提高系统的可扩展性和弹性。对于比赛快速开发服务来说,选择此架构没有一点问题,而如何进行图像识别以及识别准确率技术要求是比较大的难点。能够支持识别外卖账单、超市小票、手账、证券、支付宝微信消费截图等,且准确率较高的技术栈来说,OCR识别是一种不错的技术,此外还应训练出符合记账文本对应的分类模型以及信息抽取标注模型。以上技术难点中南大学都有考虑到且做出了比较规范的处理,比如Python的jieba分词库以及文本转换技术Word2Vec,信息抽取与关系抽取则是考虑到了序列标注模型(BiLSTM-CRF)。以上技术都较为成熟,使用起来不会有太大问题,适合快速开发。且作品还考虑到了企业端,另做能够获取消费者的消费习惯,投放广告,提高账单识别的技术框架,比较全面。

此外如有根据已存有历史数据能够自动生成历史账单画像,或者是能够结合AI大模型自动对账号数据进行评估或许能够完成的更加全面。尽管如此此作品完成程度已经足够高,简单高效最贴切竞赛主题。

开发方向

中南大学的作品代码开发方向十分清晰。前端使用Flutter框架,Flutter采用自绘引擎,具有出色的性能和渲染效果。通过使用丰富的小部件库,开发者可以轻松创建精美的用户界面,并实现高度的自定义。这使得Flutter在设计感强烈的应用程序、品牌应用以及注重用户体验的项目中具备竞争力。开发模式采取前后端分离的模式,在这种模式下,前端和后端可以独立开发,互不干扰,相互配合,最终组合成一个完整的应用程序,提高了开发效率,提高了系统的可维护性和可扩展性,前后端交互简单明了,易于调试和测试。

中南大学作品记账全能王—基于图像预处理和BERT模型的OCR账单识别系统不仅解决了市场上存在财务小票记账的痛点,也灵活地将合合信息智能图像识别模块与小票识别的API落地财务管理场景,将复杂的小票信息秒速转换成了简洁、高效的数据输入,构建了一个多场景下的财务管理工具,让用户在不同场景中都能轻松地进行记账和财务管理。

可以毫不夸张地说,BERT已经对自然语言处理进行了显著的变革。比如使用一个在大型无标号数据集上训练的模型,在11个独立的自然语言处理任务中取得佳绩。只需稍加微调就能实现。BERT引发了许多新的自然语言处理体系结构、训练方法以及语言模型,如Google TransformerXL、OpenAI的GPT-2、XLNeT、ERNIE2.0、RoBERTa等。自然语言处理的最大挑战之一是缺乏训练数据。因为自然语言处理是一个具有许多不同任务的多样化领域,大多数任务专用的数据集只包含几千或几十万个人工标记的培训示例。因此能够支撑起庞大的数据集是大模型结合其他领域的关键,运行BERT是一项GPU密集型任务,需要大量的算力资源支持。

谈到图像处理技术就不得不谈一下OCR技术了。随着技术的不断发展,OCR技术在工业界中的应用也从最开始的简单的光学字符识别拓展到涵盖图像预处理、文字识别、版面分析、文档理解等多项技术的智能文档处理领域。文档处理与人工智能的结合,可以实现对大量文档的自动化处理和分析,提高工作效率和准确性,降低人力成本和时间成本,对于企业的知识管理和业务分析具有重要的意义。合合信息依托自研的智能文字识别服务平台,在解决工业界中面临的各类问题中所做一些相关工作进展和研究成果,并探讨当前工业界中面临的一些关键技术难题和挑战。相信合合信息在模式识别、深度学习、图像处理、自然语言处理等领域的深耕厚积薄发,用技术方案惠及更多的人。

合合信息智能文档处理技术采用精准的图像裁剪、形变矫正以及去除阴影和摩尔纹等技术,利用人工智能技术对文档图像进行增强和清晰度提升,从而提高文档图像的质量和阅读体验。通过这种方法,可以有效提升文档处理下游任务的质量和效率,例如识别转换和图像分析等。目前,该技术已经被应用于智能文字识别产品,为来自全球上百个国家和地区的数亿用户提供了服务。

文档处理与人工智能的结合,可以实现对大量文档的自动化处理和分析,提高工作效率和准确性,降低人力成本和时间成本,对于企业的知识管理和业务分析具有重要的意义。 此外,未来的图文智能处理技术也将会更加可定制化,根据不同的行业和应用场景,为客户提供量身定制的解决方案。这将有助于满足客户的不同需求,提升客户的体验和满意度。

比赛发展

从技术创新的视角来看,参赛队伍展现出了深刻的思考。他们将先进的大模型技术与智能文档处理领域的实际需求相融合。通过将文本识别和文本理解技术应用于大量的消费票据,他们成功地实现了有效的分类。这项创新使得财务结算过程从过去的繁琐手动操作变为高度自动化的流程。这一实践充分展示了他们运用新技术来解决传统难题的能力。

据大数据统计,现在有百分之七十以上的大学生毕业后所从事的职业与本科专业无关。这就表示,大学生走出大学校门时,迎接他们的可能是一个完全陌生的领域,如果不想被淘汰,就必须不断充实提高自己的知识储备。由此可见,建立多元化的人才培养机制非常重要。当前,科技的创新、突破与发展越来越依赖于多学科的交叉、融合,这就对复合型人才的培养提出了更高的要求。大赛对参赛作品的评分标准也十分“仿真”,涉及技术资源及经济成本控制,对项目创意前景的判断、对市场需求的分析等方面,覆盖商业价值、社会应用价值等多方面的评估。

在这个人工智能时代,科技企业在应用场景中扮演着关键角色,并在人才培养方面发挥着重要作用。未来,各行各业都渴望拥有那些对专业学术领域有深刻理解、具备解决问题潜力的人才,特别是在不断发展的人工智能领域。在这一背景下,大赛为学生提供了一个卓越的科技领域展示平台。

科技企业通过参与这样的活动,不仅能够挖掘潜在的人才,还能够与学术界建立更紧密的联系,共同推动技术的发展和创新。总之,这种校企合作在人才培养和行业发展方面取得了显著成就,为未来的科技进步奠定了坚实基础。