ChatGPT 多模态图像识别可以破解验证码?

验证码已成为我们日常网络生活中不可或缺的一部分,为网站和应用程序提供了一道基本的安全屏障。从最开始的简单数字验证码,到现在的各种奇葩验证码,复杂性在逐步增加,用来抵御自动化工具和机器人的攻击。

下图展示了部分常见的验证码:

各种验证码展示

这些验证码存在的唯一目的就是用来区别人和机器。然而随着 ChatGPT 大模型崛起,特别是 GPT4-Vision 多模态能力的问世,验证码还能拦截住机器吗?

阅读全文

ChatGPT 图像理解能力深度体验

9 月 25 号的时候,OpenAI 公布了 ChatGPT 的新能力:ChatGPT can now see, hear, and speak,ChatGPT 终于有了“眼睛”,可以看懂图片了。

ChatGPT 可以看见了

阅读全文

ChatGPT 文字生成图片,DALL·E 3 带来全新能力!

近年来,随着人工智能技术的快速发展,文本生成图片(Text-to-Image)技术也取得了重大突破。目前 MidjourneyStable-Diffusion 是两款最受欢迎的文生图软件。

Midjourney 通过简单的文本描述就能生成具有独特艺术风格的图像,可用于创作海报、插画等。而 Stable Diffusion 则以其精细纹理和细节而闻名,更贴近照片般的效果。尽管这两者已可根据文字创作出惊艳的视觉效果,但仍存在可控性有限、难以处理抽象概念等问题。此外,这两款都需要使用者了解很多精巧的 Prompt 技巧,比如指定风格,特效等。

Midjourney, Stable Diffusion, ChatGPT&DALL·E 3

阅读全文