百度网盘批量创建群组时验证码自动识别

  • A+
所属分类:python实战案例

百度网盘在批量创建群组时会出现验证码,验证码比较复杂有时肉眼也看不清,需要不断的切换。早期通过脚本然后连接第三方打码平台接口,如:图鉴等进行自动打码,但是需要申请账号等等相对来说多了一步就多了一步的麻烦,如是想着有没有好的库自建接口直接进行打码或者直接返回已经成功的验证码和验证值。网上找到ddddocr 要求python3.8以上版本,然后通过fastapi搭建一个接口直接获取到验证码键值对。

 

  1. # -*-coding:utf-8-*-
  2. # cython: language_level=3
  3. ___author___ = 'anshingy'
  4. ___contact___ = 'qq541182238'
  5. ___date___ = '2024/12/21'
  6. import random
  7. import requests
  8. import ddddocr
  9. """
  10. Ⅰ. set_ranges 方法限定返回字符返回
  11. 本方法接受1个参数,如果输入为int类型为内置的字符集限制,string类型则为自定义的字符集
  12. 如果为int类型,请参考下表
  13. 参数值 意义
  14. 0   纯整数0-9
  15. 1   纯小写英文a-z
  16. 2   纯大写英文A-Z
  17. 3   小写英文a-z + 大写英文A-Z
  18. 4   小写英文a-z + 整数0-9
  19. 5   大写英文A-Z + 整数0-9
  20. 6   小写英文a-z + 大写英文A-Z + 整数0-9
  21. 7   默认字符库 - 小写英文a-z - 大写英文A-Z - 整数0-9
  22. 如果为string类型请传入一段不包含空格的文本,其中的每个字符均为一个待选词 如:"0123456789+-x/=""
  23. """
  24. ocr = ddddocr.DdddOcr()
  25. for j in range(10):
  26.     # random_float = random.uniform(0, 1)
  27.     url_getcaptcha = 'https://pan.baidu.com/api/getcaptcha?prod=mbox&clienttype=0&app_id=250528&web=1'
  28.     res = requests.get(url_getcaptcha).json()
  29.     raw_ans = res.get('raw_ans')
  30.     vcode_str = res.get('vcode_str')
  31.     url = res.get('vcode_img')
  32.     s = ''
  33.     for _ in range(10):
  34.         content = requests.get(url).content
  35.         with open(f'{j}.png','wb') as f:
  36.             f.write(content)
  37.         # image = open("test.jpg", "rb").read()
  38.         # ocr.set_ranges("0123456789+-x/=")
  39.         ocr.set_ranges(raw_ans)
  40.         result = ocr.classification(content, probability=True)
  41.         s = ""
  42.         for i in result['probability']:
  43.             s += result['charsets'][i.index(max(i))]
  44.         if len(s)==4:
  45.             break
  46.     print(s,vcode_str)

weinxin
我的微信公众号
爱真理,得永生!          爱在灵灵久博客,网罗天下,福利大家!