阿里开源多语言视觉文字生成与编辑模型——AnyText,AnyText对生成文字的把控可媲美专业PS,用户可自定义规划文字出现的位置,图片的强度、力度、种子数等,目前在Github超2,400颗星非常受欢迎。
【AiBase提要】
🔸阿里巴巴开源的AnyText可以在图像中生成精准的文本,支持中文。
🔸AnyText采用文本控制的扩散流程,包括辅助潜变量模块和文本嵌入模块,能够生成弯曲、不规则的字体。
🔸AnyText使用了多个OCR识别数据集和严格的过滤规则构建了AnyWord-3M数据集,提供高质量的训练数据。
模型地址:https://top.aibase.com/tool/anytext-tuwenronghe
开源地址:https://github.com/tyxsspa/AnyText