Llama3-V: 全新开源视觉大语言模型出世

2024-06-07 06:20 203 阅读 0 评论 134 点赞

近日，AI界掀起了一股新风潮，一款名为Llama3-V的全新开源视觉大语言模型横空出世!据悉，这款模型基于Llama38B和siglip-so400m，被称为最先进的视觉大语言模型之一。与此同时，该模型还具备快速本地推理的特点，让用户能够更加便捷地进行推理操作。

有关Llama3-V的一些关键特点包括:优于LLaVA约10-20%的性能表现、训练成本低于500美元以及可与GPT4-V、Gemini Ultra和Claude3相媲美的性能。同时，该模型的权重、训练和推理代码也将会开源发布，让更多的开发者能够参与其中。

现在，Llama3-V已经在Hugging Face平台和Github上发布，吸引了大量关注和好评。据悉，这款模型不仅能够优于以往的同类产品，还能够以更小的模型体积达到与其他大型模型相媲美的性能水平。

总的来说，Llama3-V的推出无疑将为AI领域带来一股新的风向，让我们拭目以待，看这款模型能为人工智能领域带来怎样的突破与创新!

HF Model：https://huggingface.co/mustafaaljadery/llama3v…

Github Repo：https://github.com/mustafaaljadery/llama3v

（举报）