[AI] 새로운 다국어 오픈소스 LLM: Qwen2.5

anpigon (71)in #kr-dev • 3 months ago (edited)

출처: https://velog.io/@korkite/%EC%A7%81%EC%A0%91-%EC%82%AC%EC%9A%A9%ED%95%B4%EB%B3%B8-%EC%95%8C%EB%A6%AC%EB%B0%94%EB%B0%94%EC%9D%98-%EC%83%88-%EC%96%B8%EC%96%B4%EB%AA%A8%EB%8D%B8-Qwen2.5-%ED%9B%84%EA%B8%B0

요약

Qwen2.5는 이전 Qwen2 모델 대비 뛰어난 성능을 제공하며, Llama3.1-70B, Mistral-Large2와 같은 유사한 규모의 모델들을 능가하는 결과를 보여줍니다. 다양한 크기(3B, 7B, 14B, 32B, 72B 등)의 모델이 제공되며, 상업적으로도 이용 가능하고, RAG 작업에 적합한 높은 포맷팅 정확도를 자랑합니다. 간단한 작업은 이제 파인튜닝 없이도 수행할 수 있으며, QLoRA 파인튜닝을 통해 각 기업의 맞춤형 작업을 개발하는 데 유용하게 사용될 것으로 기대됩니다.

Ollama에서 사용하기: https://ollama.com/library/qwen2.5
Huggingface에서 사용하기: https://huggingface.co/collections/Qwen/qwen25-66e81a666513e518adb90d9e
공식 사이트 살펴보기: https://qwenlm.github.io/blog/qwen2.5/

내용 추가: 테디노트님이 공유한 Qwen2.5 7B GGUF 모델이 Ollama에서 매우 원활하게 작동합니다. 준범님의 Qwen2.5 7B 한국어 파인튜닝 모델을 GGUF로 변환한 이 모델은 한국어 작업에 적합하며, 효율적으로 활용할 수 있습니다.

관련 내용은 테디노트님의 깃헙 리포지토리에서 확인할 수 있습니다.

_{Posted using Obsidian Steemit plugin}

#kr #krsuccess #kr-ai

3 months ago in #kr-dev by anpigon (71)

Sort:

kr-dev.cu1 (49) 3 months ago

[광고] STEEM 개발자 커뮤니티에 참여 하시면, 다양한 혜택을 받을 수 있습니다.

$0.00

jswit (69) 3 months ago

Upvoted! Thank you for supporting witness @jswit.

To turn off auto-reply, write a reply to this comment with "@jswit reply-off"
Delegate SP to jsup & receive daily upvote
Search and find Steemit posts

$0.00