印象传媒

博士用130行代码搞定核酸统计 几乎可以做到100%准确

发表于:2024-11-24 作者:印象报导
编辑最后更新 2024年11月24日,4月7日,复旦大学官微消息,3月初以来,学校启动常态化核酸筛查工作,要求班辅导员核对学生"健康云"核酸截图,做到"一人不漏"。 但是,这种人工检查费时费力,容易出错。为此,信息科学与工程学院博士生李小康快速开发小程序,几分钟内快速核查数百核酸完成截图,大大提高了核查效率和准确率。说到程序原理,李小康觉得并不复杂,他最先想到了以前学过的光学字符识别(ocr )技术。李小康说:"OCR可以识别图像中的

4月7日,复旦大学官微消息,3月初以来,学校启动常态化核酸筛查工作,要求班辅导员核对学生"健康云"核酸截图,做到"一人不漏"。 但是,这种人工检查费时费力,容易出错。

为此,信息科学与工程学院博士生李小康快速开发小程序,几分钟内快速核查数百核酸完成截图,大大提高了核查效率和准确率。

说到程序原理,李小康觉得并不复杂,他最先想到了以前学过的光学字符识别(ocr )技术。

李小康说:"OCR可以识别图像中的文字并转换为文本信息,检查很方便。 而且核酸截图是印刷字体,识别率非常高,几乎可以100%准确。 "

他还考虑了Python语言的正则表达式。 可以搜索字符串特定模式的内容。 "使用正则表达式,可以从OCR识别的文本中筛选想要的信息。 最后,查看每个屏幕快照的名称、检查时间、是否采样等信息,然后将所有人的结果输出到Excel文件中,以便于人工检查。 "

最后,李小康确定了"OCR文字识别正则表达式筛选"的程序思路。 3月15日晚上,他花了一个多小时写了初始代码。 一共130行。 程序完成后,李小康用自己类别的核酸截图数据进行验证,检测出准确率高、此前人工检查未发现的问题。

目前方案在该学院服务两周。 截图800张,几个人需要检查一个多小时,现在只需要等两分钟就能得到结果。

2022-05-12 13:38:27
0