抖音的验证码一般是这样的:解决方案通常可以选择:打码平台自己训练模型在请求量不大的情况下可以用第一种,而对于公司这种每天几千万的请求,这里就需要第二种一、我们识别的思路是什么?实际上在请求里还会带有这么一张标签图片:我们需要按照标签中给出的文字顺序点击图里的文本,因此,按照人类的思维,我们应当是如下操作:先找到标签中的文字和文本顺序再去图片中找哪几个位置有文字,这些文字是什么按照标签和图片中文字的关系进行点选而对于机器来说,我们需要转换一下第一第二步的顺序,并且我们不需要知道这个文字是什么先找出图片中找哪几个位置有文字(每个字的坐标)再去识别图中切出的文字和标签文字中的相似关系,不需要知道文字是什么最后按照顺序进行点选如果我们知道了验证部分的文字在图片中的什么位置,然后我们把每个字给剪切出来,然后再通过某种方式,识别出哪些字跟上面标签部分的字最相近不就知道了我们需要点击哪几个字了吗?这里我们可以使用yolo来进行位置识别(判断每个字的位置),再用用pytorch来训练网络模型(判断相似关系)我们需要按照他给的标签汉字顺序点击验证部分的汉字,最终要达到的效果是这样:(这张图中的精度较低,

默认分类·爬虫与逆向 · 2023-05-03 · 6129 人浏览
Theme Jasmine by Kent Liao