- A+
最近这类答题app比较火,我的同事wangtonghe为开源社区贡献了他的python代码。以下文章为他的思路,我只做了部分整理发布于掘金社区,分享给大家。
-
起因
看了《程序员如何玩转《冲顶大会》?》大受启发,不过弱点很多,需要使用付费的OCR接口、再open到百度搜索答案,我们等待加载并且寻找答案的时候,已经错失了好的机会,刚好前几天研究了下微信跳一跳的辅助,正好可以用上。
-初步思路
思路很明确,把答案截图pull过来,通过PYTHON OCR 库进行识别成文字后再放到百度搜索。匹配出现率最频繁的词语,记过几番尝试后,一些容易搜索的问题还是是可以搜索大部分答案的。
-
尝试
目前它是手动的,也就是说每次答案出现,手动执行脚本返回答案。同样由于个别题目原因(如某个词有多少笔画)虽然不是百分之百的成功率,但是一般都能进入决赛+一张复活卡基本妥妥‘吃鸡’,下面是吃鸡截图:
-
技术栈
实现语言python,用到的类库如下:
-
PIL
-
pytesseract(图片识别库)
-
BeautifulSoup(页面解析)
文字识别引擎需单独安装,参见Python人工智能之图片识别,Python3一行代码实现图片文字识别以及mac上文字识别 Tesseract-OCR for mac
主体代码如下:
要想实现更智能化,有个思路是不停的截图(1秒一次),一旦截到答题页(可以用答题页的色差来做),做文字识别后百度,将百度后的结果与选项做比较,哪个出现次数最多哪个就是最佳答案,这里可以加个判断,如果特别确定直接模拟点击事件选答案,不确定就手工。
写在最后
前几天有私信小编要Python的学习资料,小编整理了一些有深度的Python教程和参考资料,从入门到高级的都有,文件已经打包好了,正在学习Python的同学可以下载学习学习。文件下载方式:点击小编头像,关注后私信回复“资料”即可下载。首先把代码撸起来!首先把代码撸起来!首先把代码撸起来!重要的事说三遍,哈哈。“编程是门手艺活”。什么意思?得练啊。