ChatGPT 多模态图像识别可以破解验证码?
验证码已成为我们日常网络生活中不可或缺的一部分,为网站和应用程序提供了一道基本的安全屏障。从最开始的简单数字验证码,到现在的各种奇葩验证码,复杂性在逐步增加,用来抵御自动化工具和机器人的攻击。
下图展示了部分常见的验证码:
这些验证码存在的唯一目的就是用来区别人和机器。然而随着 ChatGPT 大模型崛起,特别是 GPT4-Vision 多模态能力的问世,验证码还能拦截住机器吗?
验证码已成为我们日常网络生活中不可或缺的一部分,为网站和应用程序提供了一道基本的安全屏障。从最开始的简单数字验证码,到现在的各种奇葩验证码,复杂性在逐步增加,用来抵御自动化工具和机器人的攻击。
下图展示了部分常见的验证码:
这些验证码存在的唯一目的就是用来区别人和机器。然而随着 ChatGPT 大模型崛起,特别是 GPT4-Vision 多模态能力的问世,验证码还能拦截住机器吗?
9 月 25 号的时候,OpenAI 公布了 ChatGPT 的新能力:ChatGPT can now see, hear, and speak,ChatGPT 终于有了“眼睛”,可以看懂图片了。
近年来,随着人工智能技术的快速发展,文本生成图片(Text-to-Image)技术也取得了重大突破。目前 Midjourney
和 Stable-Diffusion
是两款最受欢迎的文生图软件。
Midjourney 通过简单的文本描述就能生成具有独特艺术风格的图像,可用于创作海报、插画等。而 Stable Diffusion 则以其精细纹理和细节而闻名,更贴近照片般的效果。尽管这两者已可根据文字创作出惊艳的视觉效果,但仍存在可控性有限、难以处理抽象概念等问题。此外,这两款都需要使用者了解很多精巧的 Prompt 技巧,比如指定风格,特效等。