1.组名

潇洒不是摆烂

2.组员

黄笑然 陈佳瑶 苏国培 刘玉婷 安游珺

3.项目名

基于模板匹配的票证识别平台

4.项目介绍

我们的项目是基于模板匹配的票证识别平台。随着人工智能技术的发展,OCR技术有了重大突破,票证管理也逐渐朝着数字化的方向发展。本票证识别平台采用OCR识别技术,结合预置模板,实现自动识别票证类别,并保证识别结果以统一格式进行结构化输出,解决了票证存储难、录入难、管理难、效率低的问题,为数据的进一步智能管理及其分析,打下了坚实的基础。同时本平台支持任意固定版式卡证、票据的模板制作,用户可以通过自定义模板来获取想要的结构化内容,应用场景十分广泛,可以应用于财务票据,医疗票据,卡证等,进行票证分类、关键内容提取、信息统计分析等等,智能识别为结构化的文本,有效降低人工录入成本,提升信息管理效率。

5.设计过程

我们的项目表分为用户和模板两大部分,将用户存在一个表中,用户管理记录存在一个表中;将模板存在一个表中,模板有关的字段分别存储三个表种,模板管理也有单独的一个表,实现了模块的分离。

设计最初,我们认为应该对每一个模板都建一张表,来存储表中具体的固定字段和参考字段,但是在具体讨论之后,发现这是一个不实际的想法,一个是会带来很大的工作量,再一个是检索时很不方便,于是我们更换了思路,将所有模板储存在一个模板表中,将所有模板的固定字段存储在一个表中,再将所有模板的参考字段存储在一个表中。这样设计后,表的数量大大减少,功能也明确了很多,检索效率也可以大大提升。

用户方面的表格设计也经过了很多讨论。一开始我们认为没有必要创建一个角色表来存放所有角色,而是只将角色名作为用户表的一个属性,但是再经过商量,还是认为要将各模块的耦合程度降低,于是新建了一个角色表,也更加方便之后平台的权限管理。

6.E-R

全局

7.逻辑结构设计

序号

表名

功能说明

1

user

用户表

2

role_power

角色表

3

template

模板表

4

fixed_field

固定字段表

5

reference_field

参考字段表

6

identify_area

识别区表

7

login

登录日志表

8

preset_template_upload

预置模板上传记录表

9

user_manage

用户管理表

10

template_use

用户使用模板记录表

11

template_manage

模板管理表

8.设计心得

  1. 数据库设计要解决的第一个问题就是数据库设计人员如何全面、准确的获取业务需求,于是本组同学对照用例文档再次认真进行了分析,最终确定了表的结构和属性。
  2. 我们首先确定了一个单位需要有哪些数据项,再确定了哪些字段构成一个表,最后确定表之间有什么关系。之后我们使用实体-联系建模方法绘制了E-R图,使业务需求更加精准和消除二义性。
  3. 我们接受了一定的数据冗余来保证之后的运行性能,牺牲了空间但是节省了时间,比如将参考字段和识别区分开储存。
  4. 和组员们的讨论过程让我们理解到沟通的重要性,互相之间认真的分析交流可以理清思路,以便设计出更加合理的数据库。
  5. 数据库的设计完成离不开老师和学姐的指导,让我们明白了做项目要和老师多沟通交流,及时弄懂不清晰的地方。