NVIDIA NeMo Framework Kullanıcı Kılavuzu

Güvenlik Güncelleştirmesi Ayrıntıları:
Güvenlik güncelleştirmesi, NVIDIA NeMo Framework'te kod yürütme ve veri kaybına yol açabilecek bir güvenlik açığını giderir.amperiyor.

Yazılım güncellemesi:
Daha önceki bir dal sürümü kullanıyorsanız, güvenlik sorununu gidermek için en son dal sürümüne yükseltmeniz önerilir.

Üzerindeview

NVIDIA NeMo Framework, araştırmacılar ve geliştiriciler için geliştirilmiş ölçeklenebilir ve bulut tabanlı bir yapay zeka çerçevesidir. Büyük Dil Modelleri, Çok modlu ve Konuşma AI (örneğin Otomatik Konuşma Tanıma Ve Metinden Konuşmaya). Kullanıcıların mevcut kod ve önceden eğitilmiş model kontrol noktalarından yararlanarak yeni üretken yapay zeka modellerini verimli bir şekilde oluşturmasını, özelleştirmesini ve dağıtmasını sağlar.

Kurulum Talimatları: NeMo Framework'ü yükleyin

Büyük Dil Modelleri ve Çok Modlu Modeller
NeMo Framework, Büyük Dil Modelleri (LLM'ler) ve Çok Modlu Modeller (MM'ler) geliştirmek için uçtan uca destek sağlar. Şirket içinde, bir veri merkezinde veya tercih ettiğiniz bulut sağlayıcısıyla birlikte kullanım esnekliği sağlar. Ayrıca SLURM veya Kubernetes etkin ortamlarda yürütmeyi destekler.

Veri Düzenleme
NeMo Küratörü [1] veri madenciliği ve sentetik veri üretimi için bir modül paketi içeren bir Python kütüphanesidir. Ölçeklenebilir ve GPU'lar için optimize edilmişlerdir, bu da onları LLM'leri eğitmek veya ince ayar yapmak için doğal dil verilerini düzenlemek için ideal hale getirir. NeMo Curator ile kapsamlı ham verilerden yüksek kaliteli metni verimli bir şekilde çıkarabilirsiniz web Veri kaynakları.

Eğitim ve Özelleştirme

NeMo Framework, verimli eğitim ve özelleştirme için araçlar sağlar Yüksek Lisans Dereceleri ve Çok Modlu modeller. Hesaplama kümesi kurulumu, veri indirme ve yeni veri kümeleri ve modeller üzerinde eğitime ayarlanabilen model hiperparametreleri için varsayılan yapılandırmaları içerir. Ön eğitime ek olarak, NeMo hem Denetlenen İnce Ayar (SFT) hem de LoRA, Ptuning ve daha fazlası gibi Parametre Verimli İnce Ayar (PEFT) tekniklerini destekler.

NeMo'da eğitimi başlatmak için iki seçenek mevcuttur: NeMo 2.0 API arayüzünü kullanmak veya NeMo Run'ı kullanmak.

NeMo Run ile (Önerilen): NeMo Run, çeşitli hesaplama ortamlarında deneylerin yapılandırılmasını, yürütülmesini ve yönetimini kolaylaştırmak için bir arayüz sağlar. Bu, iş istasyonunuzda yerel olarak veya büyük kümelerde işleri başlatmayı içerir - hem SLURM etkin hem de bulut ortamında Kubernetes.
- NeMo Run ile Ön Eğitim ve PEFT Hızlı Başlangıç
NeMo 2.0 API'sini kullanma: Bu yöntem, küçük modeller içeren basit bir kurulumla veya kendi özel veri yükleyicinizi, eğitim döngülerinizi yazmakla veya model katmanlarını değiştirmekle ilgileniyorsanız iyi çalışır. Size yapılandırmalar üzerinde daha fazla esneklik ve kontrol sağlar ve yapılandırmaları programatik olarak genişletmeyi ve özelleştirmeyi kolaylaştırır.
- TraNeMo 2.0 API ile Hızlı Başlangıç
- NeMo 1.0'dan NeMo 2.0 API'sine geçiş

Hizalama

NeMo-Hizalayıcı [1] verimli model hizalaması için ölçeklenebilir bir araç takımıdır. Araç takımı, SteerLM, DPO, İnsan Geri Bildiriminden Güçlendirme Öğrenmesi (RLHF) ve çok daha fazlası gibi son teknoloji model hizalama algoritmalarını destekler. Bu algoritmalar kullanıcıların dil modellerini daha güvenli, zararsız ve yararlı olacak şekilde hizalamalarını sağlar.
Tüm NeMo-Aligner kontrol noktaları NeMo ekosistemiyle çapraz uyumludur ve bu da daha fazla özelleştirme ve çıkarım dağıtımına olanak tanır.

Küçük bir GPT-2B modelinde RLHF'nin üç aşamasının adım adım iş akışı:

SFT eğitimi
Ödül modeli eğitimi
PPO eğitimi

Ayrıca, çeşitli diğer yeni hizalama yöntemlerine de destek gösteriyoruz:

VDP: RLHF'ye kıyasla daha basit bir kayıp fonksiyonuna sahip, daha hafif bir hizalama algoritmasıdır.
Kendi kendine oyun İnce Ayar (SPIN)
YönlendirLM: Koşullandırılmış-SFT'ye dayalı, yönlendirilebilir çıktıya sahip bir teknik.

Daha fazla bilgi için dokümanlara göz atın: Hizalama Belgeleri

Çok Modlu Modeller

NeMo Framework, çeşitli kategorilerde en son teknoloji ürünü çok modlu modelleri eğitmek ve dağıtmak için optimize edilmiş yazılım sağlar: Çok Modlu Dil Modelleri, Görme-Dil Temelleri, Metinden Görüntüye modeller ve Sinirsel Işıltı Alanları (NeRF) kullanılarak 2B Üretiminin ötesinde.
Her kategori, metin, resim ve 3 boyutlu modeller de dahil olmak üzere çok çeşitli veri türlerini işlemek için son teknoloji modellerden yararlanarak alandaki belirli ihtiyaçları ve gelişmeleri karşılamak üzere tasarlanmıştır.

Not
Çok modlu modeller için desteği NeMo 1.0'dan NeMo 2.0'a taşıyoruz. Bu arada bu alanı keşfetmek istiyorsanız lütfen NeMo 24.07 (önceki) sürümüne ait belgelere bakın.

Dağıtım ve Çıkarım
NeMo Framework, farklı dağıtım senaryolarına ve performans ihtiyaçlarına hitap ederek LLM çıkarımı için çeşitli yollar sağlar.

NVIDIA NIM ile dağıtın

NeMo Framework, NVIDIA NIM aracılığıyla kurumsal düzeydeki model dağıtım araçlarıyla sorunsuz bir şekilde bütünleşir. Bu bütünleşme, NVIDIA TensorRT-LLM tarafından desteklenir ve optimize edilmiş ve ölçeklenebilir çıkarım sağlar.
NIM hakkında daha fazla bilgi için NVIDIA'yı ziyaret edin webalan.

TensorRT-LLM veya vLLM ile dağıtın

NeMo Framework, modelleri iki çıkarım optimize edilmiş kütüphane olan TensorRT-LLM ve vLLM'ye aktarmak ve aktarılan modeli NVIDIA Triton Inference Server ile dağıtmak için betikler ve API'ler sunar.
Optimize edilmiş performans gerektiren senaryolar için NeMo modelleri, NVIDIA GPU'larında LLM çıkarımını hızlandırmak ve optimize etmek için özel bir kütüphane olan TensorRT-LLM'den yararlanabilir. Bu süreç, NeMo modellerini nemo.export modülünü kullanarak TensorRT-LLM ile uyumlu bir biçime dönüştürmeyi içerir.
- LLM Dağıtımı Bittiview
- NeMo Büyük Dil Modellerini NIM ile Dağıtın
- TensorRT-LLM ile NeMo Büyük Dil Modellerini Dağıtın
- NeMo Büyük Dil Modellerini vLLM ile Dağıtın

Desteklenen Modeller

Büyük Dil Modelleri

Büyük Dil Modelleri
Büyük Dil Modelleri	Ön Eğitim ve SFT	EKİP	Hizalama	FP8 Eğitim Yakınsaması	TRT/TRTLLM	Sarılma Yüzüne Dönüştür ve Sarılma Yüzünden Dönüştür	Değerlendirme
Lama3 8B/70B, Lama3.1 405B	Evet	Evet	x	Evet (kısmen doğrulandı)	Evet	İkisi birden	Evet
Karıştırma 8x7B/8x22B	Evet	Evet	x	Evet (doğrulanmamış)	Evet	İkisi birden	Evet
Nemotron3 8B	Evet	x	x	Evet (doğrulanmamış)	x	İkisi birden	Evet
Nemotron4 340B	Evet	x	x	Evet (doğrulanmamış)	x	İkisi birden	Evet
Baichuan2 7B	Evet	Evet	x	Evet (doğrulanmamış)	x	İkisi birden	Evet
SohbetGLM3 6B	Evet	Evet	x	Evet (doğrulanmamış)	x	İkisi birden	Evet
Gemma 2B/7B	Evet	Evet	x	Evet (doğrulanmamış)	Evet	İkisi birden	Evet
Gemma2 2B/9B/27B	Evet	Evet	x	Evet (doğrulanmamış)	x	İkisi birden	Evet
Mamba2 130M/370M/780M/1.3B/2.7B/8B/ Hybrid-8B	Evet	Evet	x	Evet (doğrulanmamış)	x	x	Evet
Phi3 mini 4k	x	Evet	x	Evet (doğrulanmamış)	x	x	x
Qwen2 0.5B/1.5B/7B/72B	Evet	Evet	x	Evet (doğrulanmamış)	Evet	İkisi birden	Evet
Yıldız Kodlayıcı 15B	Evet	Evet	x	Evet (doğrulanmamış)	Evet	İkisi birden	Evet
YıldızKodlayıcı2 3B/7B/15B	Evet	Evet	x	Evet (doğrulanmamış)	Evet	İkisi birden	Evet
BERT 110M/340M	Evet	Evet	x	Evet (doğrulanmamış)	x	İkisi birden	x
T5 220M/3B/11B	Evet	Evet	x	x	x	x	x

Görme Dil Modelleri

Görme Dil Modelleri
Görme Dil Modelleri	Ön Eğitim ve SFT	EKİP	Hizalama	FP8 Eğitim Yakınsaması	TRT/TRTLLM	Sarılma Yüzüne Dönüştür ve Sarılma Yüzünden Dönüştür	Değerlendirme
NeVA (LLaVA 1.5)	Evet	Evet	x	Evet (doğrulanmamış)	x	İtibaren	x
Lama 3.2 Vizyon 11B/90B	Evet	Evet	x	Evet (doğrulanmamış)	x	İtibaren	x
LLaVA Sonraki (LLaVA 1.6)	Evet	Evet	x	Evet (doğrulanmamış)	x	İtibaren	x

Modelleri Yerleştirme

Modelleri Yerleştirme
Dil Modellerini Yerleştirme	Ön Eğitim ve SFT	EKİP	Hizalama	FP8 Eğitim Yakınsaması	TRT/TRTLLM	Sarılma Yüzüne Dönüştür ve Sarılma Yüzünden Dönüştür	Değerlendirme
SBERT340M	Evet	x	x	Evet (doğrulanmamış)	x	İkisi birden	x
Lama 3.2 1B'yi Yerleştirme	Evet	x	x	Evet (doğrulanmamış)	x	İkisi birden	x

Dünya Vakıf Modelleri

Dünya Vakıf Modelleri
Dünya Vakıf Modelleri	Eğitim Sonrası	Hızlandırılmış Çıkarım
Cosmos-1.0-Yayılma-Metin2Dünya-7B	Evet	Evet
Cosmos-1.0-Yayılma-Metin2Dünya-14B	Evet	Evet
Cosmos-1.0-Yayılma-Video2World-7B	Yakında gelecek	Yakında gelecek
Cosmos-1.0-Yayılma-Video2World-14B	Yakında gelecek	Yakında gelecek
Cosmos-1.0-Otoregresif-4B	Evet	Evet
Cosmos-1.0-Otoregresif-Video2World-5B	Yakında gelecek	Yakında gelecek
Cosmos-1.0-Otoregresif-12B	Evet	Evet
Cosmos-1.0-Otoregresif-Video2World-13B	Yakında gelecek	Yakında gelecek

Not
NeMo ayrıca hem difüzyon hem de otoregresif mimariler için ön eğitimi destekler text2world temel modelleri.

Konuşma AI

Konuşma AI modelleri geliştirmek, belirli alanlardaki modelleri tanımlamayı, oluşturmayı ve eğitmeyi içeren karmaşık bir süreçtir. Bu süreç genellikle yüksek bir doğruluk düzeyine ulaşmak için birkaç yineleme gerektirir. Genellikle yüksek doğruluk elde etmek, çeşitli görevler ve alana özgü veriler üzerinde ince ayar yapmak, eğitim performansını garantilemek ve modelleri çıkarım dağıtımı için hazırlamak için birden fazla yineleme içerir.

NeMo Framework, Konuşma AI modellerinin eğitimi ve özelleştirilmesi için destek sağlar. Bu, Otomatik Konuşma Tanıma (ASR) ve Metinden Konuşmaya (TTS) sentezi gibi görevleri içerir. NVIDIA Riva ile kurumsal düzeyde üretim dağıtımına sorunsuz bir geçiş sunar. Geliştiricilere ve araştırmacılara yardımcı olmak için NeMo Framework, en son teknoloji önceden eğitilmiş kontrol noktaları, yeniden üretilebilir konuşma verisi işleme araçları ve konuşma veri kümelerinin etkileşimli keşfi ve analizi için özellikler içerir. Konuşma AI için NeMo Framework'ün bileşenleri şunlardır:

Eğitim ve Özelleştirme
NeMo Framework, konuşma modellerini eğitmek ve özelleştirmek için gereken her şeyi içerir (ASR, Konuşma Sınıflandırması, Konuşmacı Tanıma, Konuşmacının Günlüğü, Ve TTS) tekrarlanabilir bir şekilde.

SOTA Önceden Eğitilmiş Modeller

NeMo Framework, çeşitli programların en son tariflerini ve önceden eğitilmiş kontrol noktalarını sağlar. ASR Ve TTS modeller ve bunların nasıl yükleneceğine dair talimatlar.
Konuşma Araçları
NeMo Framework, ASR ve TTS modelleri geliştirmek için yararlı bir dizi araç sağlar, bunlar şunları içerir:
- NeMo Zorunlu Hizalayıcı (NFA) token, kelime ve segment düzeyinde zaman ölçümü oluşturmak içinampNeMo'nun CTC tabanlı Otomatik Konuşma Tanıma modellerini kullanarak konuşma seslerini sese dönüştürün.
- Konuşma Veri İşlemcisi (SDP), konuşma verisi işlemeyi basitleştirmek için bir araç takımı. Veri işleme işlemlerini bir yapılandırmada temsil etmenize olanak tanır file, kalıp kodları en aza indirerek yeniden üretilebilirlik ve paylaşılabilirliğe olanak tanır.
- Konuşma Veri Gezgini (SDE), Dash tabanlı web Konuşma veri kümelerinin etkileşimli keşfi ve analizi için uygulama.
- Veri seti oluşturma aracı uzun ses dosyalarını hizalamak için işlevsellik sağlayan fileİlgili transkriptlerle birlikte bunları Otomatik Konuşma Tanıma (ASR) modeli eğitimine uygun daha kısa parçalara bölün.
- Karşılaştırma Aracı ASR Modellerinin kelime doğruluğu ve ifade düzeyinde farklı ASR modellerinin tahminlerini karşılaştırması.
- ASR Değerlendiricisi ASR modellerinin ve Ses Etkinliği Algılama gibi diğer özelliklerin performansını değerlendirmek için.
- Metin Normalizasyon Aracı Metni yazılı biçimden sözlü biçime ve tam tersine dönüştürmek için (örneğin “31st” ve “thirty first”).
Dağıtım Yolu
NeMo Framework kullanılarak eğitilen veya özelleştirilen NeMo modelleri NVIDIA Riva ile optimize edilebilir ve dağıtılabilir. Riva, basmalı düğme dağıtımı için adımları otomatikleştirmek üzere özel olarak tasarlanmış kapsayıcılar ve Helm grafikleri sağlar.

Diğer Kaynaklar

GitHub Depoları

NeMo: NeMo Framework için ana depo
NeMo–Koşmak: Makine öğrenimi deneylerinizi yapılandırmak, başlatmak ve yönetmek için bir araç.
NeMo-Hizalayıcı: Verimli model hizalaması için ölçeklenebilir araç takımı
NeMo-Küratör: LLM'ler için ölçeklenebilir veri ön işleme ve küratörlük araç takımı

Yardım Alma
NeMo topluluğuyla etkileşime geçin, sorular sorun, destek alın veya hataları bildirin.

NeMo Tartışmaları
NeMo Sorunları

Programlama Dilleri ve Çerçeveleri

piton: NeMo Framework'ü kullanmak için ana arayüz
Pişirici meşale: NeMo Framework, PyTorch'un üzerine kurulmuştur

Lisanslar

NeMo Github deposu Apache 2.0 lisansı altında lisanslanmıştır
NeMo Framework, NVIDIA AI ÜRÜN SÖZLEŞMESİ kapsamında lisanslanmıştır. Konteyneri çekip kullanarak, bu lisansın hüküm ve koşullarını kabul etmiş olursunuz.
NeMo Framework konteyneri, Meta Llama3 Topluluk Lisans Sözleşmesi tarafından yönetilen Llama materyallerini içerir.

Dipnotlar
Şu anda, NeMo Curator ve NeMo Aligner'ın Multimodal modeller için desteği devam eden bir çalışma olup çok yakında kullanıma sunulacaktır.

SSS

S: Sistemimin güvenlik açığından etkilenip etkilenmediğini nasıl kontrol edebilirim?
A: NVIDIA NeMo Framework'ün yüklü sürümünü doğrulayarak sisteminizin etkilenip etkilenmediğini kontrol edebilirsiniz. Sürüm 24'ün altındaysa sisteminiz savunmasız olabilir.

S: CVE-2025-23360 güvenlik sorununu kim bildirdi?
A: Güvenlik sorunu Or Peles – JFrog Security tarafından bildirildi. NVIDIA onların katkısını kabul ediyor.

S: Gelecekteki güvenlik bülteni bildirimlerini nasıl alabilirim?
A: Güvenlik bülteni bildirimlerine abone olmak ve ürün güvenlik güncelleştirmeleri hakkında bilgi sahibi olmak için NVIDIA Ürün Güvenliği sayfasını ziyaret edin.

Belgeler / Kaynaklar

NVIDIA NeMo Çerçevesi [pdf] Kullanıcı Kılavuzu
NeMo Çerçevesi, NeMo, Çerçeve

Referanslar

Kullanıcı Kılavuzu

NVIDIA NeMo Çerçevesi

Özellikler

Ürün Kullanım Talimatları

Üzerindeview

Eğitim ve Özelleştirme

Hizalama

Çok Modlu Modeller

Desteklenen Modeller

Konuşma AI

SSS

Belgeler / Kaynaklar

Referanslar

Yorum bırakın

Cevabı iptal et