欢迎您访问无忧自考网!

复旦博士生写Python脚本识别核酸截图。是怎么做出来的?

更新时间:2023-01-01 09:27:00作者:51data

近日,复旦大学博士生写Python脚本检查核酸截图的故事被人民日报公众号报道,称赞其所学贡献了青春的力量!

复旦博士生写Python脚本识别核酸截图。是怎么做出来的?

首先,这位博士所学而有用的精神,技术并不难,但有助于瘟疫的流行,我确信值得学习。

你知道很多人说博士用这么简单的东西,也可以刊登在人民日报上吗?

我想说技术不是难事,只要能解决眼前的当务之急,帮助别人就有价值。

所以,看了这篇文章的伙伴也想说一句,绝对不要为实现NB的技术而高兴。 真正值得自豪的是这项技术是否改变了世界。 即使是细微的变化。

查看人民日报的详细报道,是用Python编写的脚本。 试着整理一下这个过程和实现的技术吧。

1、引入Python的OCR库识别图像,生成文本字符串仔细观察,身边到处都能看到OCR的身影。 文件扫描、车牌识别、证件识别、银行卡识别、票据识别等。

OCR的本质是图像识别,包括文本检测和字符识别两个关键技术。

首先提取图像中的特征检测目标区域,然后对目标区域的文字进行分割和分类。

Python有很多ocr第三方库,如PaddleOCR、cnOCR、easyocr等。 一般安装后,可以直接导入import,传递图像路径参数,直接调用接口函数识别该图像。

例如,书就像是PaddleOCR的接口调用

from paddleocr import PaddleOCR、draw_ocr# Paddleocr您可以通过更改lang参数在当前支持的多种语言之间切换。 #例如,` ch `,` en `,` fr `,` german `,` korean `,` Japan ` ocr=paddle ocr ( use _ angle _ cls=true,lang=& #039; ch& #039; ) img_path=& #039;/imgs/test.jpg& #039; result=ocr

输出:

17:28检测结果查询检测结果【阴性】姓名亲卫队样本时间 2022-04-08 12:28试剂码48检测项目新冠抗原经ocr图像文本识别,出现上述结果,时间

2、需要通过正则表达式识别文本信息,提取关键词,得到文本信息,再进行整理提取,将各个类别填入excel的表里

这里需要使用正则表达式处理文本,提取重要的文本。 在此抽取的是时间、姓名、检查结果、试剂代码、检查项目等。

说到正则表达式,正则表达式( Regular Expression )通常用于查找和替换与某个模式(规则)匹配的文本。

这里的Regular是规则、法则的意思,Regular Expression是“记述某个规则的表现”的意思。

那么,提取上面的文本信息吧

#re模块输入结果=& amp; #039; & #039; & #039; 17:28检测结果查询检测结果【阴性】姓名亲卫队样品时间 2022-04-08 12:28试剂码48检测项目新冠抗原& #039; & #039; & #039; name=re.ff STRS(time=re.findall ( ) (=采样时间 ),strs ) result=re.findall ( ( ) ) )、strs

[& #039; 朱卫军& #039; ][& #039; 2022-04-08 12:28& #039; ][& #039; 阴性& #039; ]3、将结果输出到excel表格在正则表达式中提取重要信息后,在pandas中将数据输出到excel。 这里有必要适当调整数据

importpandasaspdimportnumpyasnpinfo1=nametimeresultinfo1=NP.array ( info1).reshape ( 1,3 ) df=PD.dataframe (数据帧) #039;时间& #039;& #039; 检测结果& #039; )、核酸结果. xlsx、index=False )大家也可以尝试拥有自己的核酸结果

为您推荐

核酸统计难吗?这个博士生用130行代码就做到了!市民呼吁:防疫从“我”开始

人工核查核酸报告,费时费力又易出错,怎么办?复旦大学博士生李小康快速开发了一项小程序,几分钟就能快速核查数百人,大大提高了核查效率和精度。从1小时到2分钟,一串代码搞定复旦大学自3月初启动常态化核酸筛查工作以来,要求班级辅导员必须核查学生“

2023-01-01 09:22

晚安,10:00(2022年3月12日)2008年冬季残奥会闭幕式独家剧透:特殊装置将保留“双奥运之城”的记忆

北京2022年冬残奥会闭幕式将于3月13日上演,导演沈晨在接受新华社记者专访时透露,闭幕式的主题为“在温暖中永恒”,将用一个特殊的装置配合主视觉形象,将过去9天赛事的感人瞬间,以及北京这座“双奥之城”的伟大时刻,永远保留下来。沈晨在接受采访

2023-01-01 09:22

上海央企工程师“精算”优化核酸检测:学以致用,挺身而出!

如果统计4月8日的微博热词“博士”二字一定会上榜当日#理工科博士夫妇熬夜优化社区核酸检测方案##复旦博士用130行代码搞定核酸统计#两个话题相继登上热搜累计阅读量超过2亿咋回事?原来,两个话题都在讲述上海市民学以致用为所在区域作出积极贡献

2023-01-01 09:21

学以致用,复旦大学李晓康博士写了130行代码,实现核酸结果的快速准确统计。

自三月初以来,复旦大学要求学生及教师启动常态化核酸筛查工作,每位班级辅导员必须核查学生“健康云”核酸完成截图,确保疫情下“不漏一人”。这项看起来比较简单的工作,实则操作起来异常的麻烦,辅导员需要一个个截图点开去做核查,单一个班级的截图可能就

2023-01-01 09:20

来了!北京残奥会开幕式独家剧透

3月4日2022年北京冬残奥会开幕式即将精彩亮相世界的目光将再次聚焦国家体育场“鸟巢”△资料图/视觉中国张艺谋最新剧透“开幕式的感觉是五彩斑斓”北京冬残奥会开幕式以“生命的绽放”为主题将在80分钟左右的时间里通过10多个场上环节展现残疾人的

2023-01-01 09:19

残奥会闭幕式剧透:鸟巢有特殊装置。

北京2022年冬残奥会闭幕式将于13日上演,导演沈晨在接受新华社记者专访时透露,闭幕式的主题为“在温暖中永恒”,将用一个特殊的装置配合主视觉形象,将过去9天赛事的感人瞬间,以及北京这座“双奥之城”的伟大时刻,永远保留下来。资料图 图文无关

2023-01-01 09:18

加载中...