当前位置: 首页 > news >正文

实现一种超轻量级的有线表格识别方法(有代码,可部署)

一.简介

在无意间看到一篇CBMS2021的一篇论文《NanoNetReal-Time Polyp Segmentation in Video Capsule Endoscopy and Colonoscopy》,

该论文是专为视频胶囊内窥镜和结肠镜图像的息肉分割设计的架构,是一种医学图像分割的方法。

故打算基于以上模型的架构去实现一超轻量级的有线表格识别方法,模型训练后的大小为 1MB 左右(是不是贼轻量),用于手动移动部署毫无压力。

训练数据自己标注的,共1000张左右,要想效果好,可增加数据量,模型利用tensorflow训练。

为了用户轻松自由毫无压力使用,我这里已经将tensorflow训练的模型转为onnx格式了,识别推理只需要用onnxruntime即可。

640

二.实现功能

  • 识别表格中的线条
  • 结果转为excel

三.weights模型文件

模型文件:

  1. models/model.h5

  2. models/table_light_line.onnx

训练(tensorflow2.5版本训练)

见本项目中的train/train.py

四.onnx识别

见本项目中的onnx_infer/onnx_inference.py

 

from onnx_infer.table_build import table_xlsx
from onnx_infer.table_line import load_table_wire_line_model, table_line
from onnx_infer.table_structure_reg import table_ceil
from onnx_infer.utils import draw_linestable_wire_model_path = '../models/table_light_line.onnx'# load model
table_wire_model = load_table_wire_line_model(table_wire_model_path)import cv2table_img = '../test_imgs/6.jpg'table_img = cv2.imread(table_img)# get rows and columns
rowboxes, colboxes = table_line(table_wire_model, table_img)# draw lines
img = draw_lines(table_img, rowboxes + colboxes, color=(255, 0, 0), lineW=2)
cv2.imwrite('../test_imgs/6_line.jpg', img)# get ceil boxes
ceilboxes = table_ceil(table_img, rowboxes, colboxes)print(ceilboxes)# convert to an excel table
workbook = table_xlsx(ceilboxes)
workbook.save('table_ceil.xlsx')

 

 五.部分识别结果展示

转为excel结构中,表格里的每个单元格的文字“cell-test”是人为加入的,后面可以结合ocr将文字填入单元格中。

640

640

640

 

640

640

640

六.完整项目

https://github.com/jiangnanboy/nanonet_table_line_recognition

 

http://www.zskr.cn/news/53778.html

相关文章:

  • 渗透测试
  • 2025 最新推荐飞达剥标机优质厂家口碑榜:进口零件 + 全链条服务,前推式飞达剥标机/后撤式飞达剥标机/片料式飞达剥标机/飞达剥标机供料器公司推荐
  • DataGrip2025.2.4 11月最新版 安装、授权、使用说明
  • 2025年比较好的网红小火车厂家最新TOP实力排行
  • 2025年评价高的景区轨道观光小火车热门厂家推荐榜单
  • 2025年评价高的成都活动房厕所市场热度榜
  • 2025年靠谱的液压油滤油机厂家最新TOP实力排行
  • 2025年比较好的mvr蒸发器厂家最新实力排行
  • 2025年口碑好的工业废水蒸发器TOP实力厂家推荐榜
  • 2025年靠谱的系泊缆绳厂家实力及用户口碑排行榜
  • 2025年评价高的船用绳缆TOP品牌厂家排行榜
  • 2025年热门的船用绳缆厂家最新推荐权威榜
  • 2025年质量好的精密部件视觉点数包装机最新TOP品牌厂家排行
  • 2025年评价高的管道加热带厂家推荐及选购指南
  • 【GitHub每日速递 20251119】免费开源全学段数学教材,打破教育资源获取壁垒!附文件合并及下载攻略
  • 2025年质量好的港口浮吊厂家推荐及选择指南
  • 2025年靠谱的金蝶软件服务力排行榜
  • 2025年靠谱的财务软件管理商用系统优选榜
  • 2025年知名的杭州服务业财务软件高性价比榜单
  • linux crontab 任务
  • linux cpu调度
  • 应用安全 --- 代码块保护
  • linux cpu 占用高
  • linux cos()
  • linux chrome 下载
  • linux cdc
  • 2025年11月美国留学中介实勘推荐:10家靠谱机构清单,附藤校录取密码
  • 香港中文大学(深圳) BIO1008 - Chemistry and Life Sciences 生物部分重要单词和短语表
  • 创业圈的认知升级开始了?
  • OBDSTAR MS50 Basic: 1-Year Update Service – Must-Have for EU/US Car Diagnostics Repairs