苹果图像模型 Manzano 曝光,媲美 ChatGPT
近日,苹果公司发布了一篇研究论文,揭晓了其在图像处理领域的最新力作:一个名为Manzano的新型图像模型。Manzano的核心突破在于它巧妙地融合了图像理解与图像生成这两项关键能力。当前,许多开源模型往往顾此失彼,难以同时精通这两项任务,而商业闭源系统则普遍具备这种双重能力。苹果的研究表明,Manzano的设计旨在弥合这一差距,使其在处理效率和最终效果上,能够与GPT-4o及谷歌的图像生成技术等顶级商业系统相提并论。
尽管苹果尚未公开发布Manzano,也未提供任何公开演示,但其研究团队分享的论文及附带的低分辨率样本,已经足够展示其强大的潜力。在面对复杂和挑战性的提示时,Manzano的生成结果与GPT-4o及谷歌Nano Banana模型的输出不相上下。(PConline太平洋科技)
原创文章,作者:DEV编辑,如若转载,请注明出处:https://devcn.xin/6145.html