“Dolly: Ücretsiz ve Açık Kaynaklı ChatGPT Tarzı Yapay Zeka Modeli Manşete Çıkıyor”


veri tuğlaları

Databricks kısa süre önce, insan tarafından oluşturulan bir veri setinde ince ayarı yapılmış, ticari kullanım için ilk açık kaynaklı, yönergeleri izleyen büyük dil modeli (LLM) olan Dolly 2.0’ı piyasaya sürdü. Bu, homebrew ChatGPT rakipleri için ideal bir başlangıç ​​noktası olarak kullanılabilir.

Şirket, 2013 yılında Apache Spark’ın yaratıcıları tarafından kuruldu ve Spark ile büyük veri ve makine öğrenimi için web tabanlı bir platform sunuyor. Dolly’nin lansman blog yazısı, yeni modelin kuruluşların üçüncü taraflarla veri paylaşmadan veya API erişimi için ödeme yapmadan LLM’ler oluşturmasına ve özelleştirmesine izin verdiğini söylüyor.

Yeni 12 milyar parametreli Dolly 2.0 modeli, EleutherAI’nin pythia model ailesini temel alır ve Databricks çalışanlarından toplanan “databricks-dolly-15k” adlı eğitim verilerine özel olarak ince ayar yapılmıştır. Bu, OpenAI’nin daha iyi bir ham LLM olan ve soruları yanıtlayabilen ve bir sohbet robotu olarak diyaloga girebilen ChatGPT ile uyumlu olarak daha fazla yetenek sağladı.

Mart ayında piyasaya sürülen Dolly 1.0, OpenAI’nin hizmet şartlarına tabi olan eğitim verileri nedeniyle ticari kullanımda sınırlamalarla karşılaşıyordu. Databricks’in ekibi, Mart ve Nisan 2023 arasında 5.000’den fazla çalışanından, yarışmalar ve veri üretimi için belirlenmiş görevler aracılığıyla 13.000’den fazla talimat takip davranışı gösterisinden oluşan yeni bir veri seti oluşturarak bu sorunu ele aldı.

Ortaya çıkan veri seti, Dolly’nin model ağırlıkları ve eğitim koduyla birlikte Creative Commons lisansı altında yayınlandı ve tamamen açık kaynak yapıldı; Bunun aksine, OpenAI’nin ChatGPT’si, kullanıcıların API erişimi için ödeme yapmasını ve belirli hizmet koşullarına uymasını gerektiren, potansiyel olarak işletmeler ve kuruluşlar için esneklik ve özelleştirme seçeneklerini sınırlayan tescilli bir modeldir.

AI araştırmacısı Simon Willison’a göre Dolly 2.0 “gerçekten büyük bir anlaşma”. Ayrıca, ince ayar talimat setinin 5.000 Databricks çalışanı tarafından elle yapıldığından ve bir CC lisansı altında piyasaya sürüldüğünden bahsetti. Bu, Dolly 2.0’ın potansiyel olarak ticari kullanımdaki özel sınırlamalar veya kısıtlamalarla kısıtlanmayan yeni bir açık kaynak dil modelleri dalgasını ateşleyebileceği anlamına gelir.

Dolly’nin performans yeteneği belirsizliğini korusa da, daha fazla ayrıntılandırmanın makul derecede güçlü LLM’lerin tüketici sınıfı makinelerde çalıştırılmasına izin vermesi bekleniyor. Şu anda Dolly ağırlıkları Hugging Face’te mevcuttur ve “databricks-dolly-15k” veri seti GitHub’da bulunabilir.

Reklamcılık


Kaynak : https://insidexpress.com/technology/dolly-the-free-and-open-source-chatgpt-style-ai-model-making-headlines/?utm_source=rss&utm_medium=rss&utm_campaign=dolly-the-free-and-open-source-chatgpt-style-ai-model-making-headlines

Yorum yapın

SMM Panel PDF Kitap indir