在构建文本信息的过程中,Recraft团队采用的是TextDiffuser-2的表征方式,每一行文本首先记录了文本的内容,随后通过坐标来指明文本的具体区域。但是与TextDiffuser-2不同的是,Recraft用了三个坐标点表示文本,使得模型能够支持渲染倾斜的文本。