in AIニュース

Llama 3 + QLoRA: AI技術の魅力を体験する最新のファインチューニング方法

by Ruslan Dev 2024年10月21日, 05:03 42 Comments

Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

AI技術は現代社会においてますます重要性を増しており、その魅力は多岐にわたります。まず第一に、AI技術は私たちの生活を効率化し、便利さを提供しています。例えば、AIアシスタントや自動運転車などが日常的に使用されるようになりました。

また、AI技術はビジネス分野でも革新をもたらしており、データ解析や予測分析などの領域で劇的な進歩が見られています。これにより企業はより的確な意思決定を行うことができるようになり、競争力を高めることが可能となっています。

さらに、AI技術は医療分野や環境保護活動などの社会問題解決にも貢献しています。例えば、医療画像解析や気候変動モデリングなどでAI技術の活用が進んでおり、人類全体の福祉向上に寄与しています。

このように、AI技術は様々な分野で革新的かつ有益な成果をもたらしており、ますますその重要性が高まっていると言えます。そのため、今後もAI技術の発展と活用が進むことが期待されています。

動画はこちら

Written by Ruslan Dev

コメントを残すコメントをキャンセル

GIPHY App Key not set. Please check settings

42 Comments

Sort by

@ruslandev says:

2024年10月21日 at 05:03 Copy Link of a Comment

Вышла новая часть – Файнтюнинг и квантизация Llama-3-70B https://youtu.be/ML4M1UQHxbU
Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском.
А также я показал процесс квантизации модели с сохранением в формат gguf.

0

返信
@IvanOldan says:

2024年10月21日 at 05:03 Copy Link of a Comment

Я вот только не понял зачем ваш спонсор предлагает покупать 3090 за потинник в месяц?

0

返信

@Alexandr_Ogorodnik says:

2024年10月21日 at 05:03 Copy Link of a Comment

Это очень интересно спасибо

0

返信
@malysh86 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Вот это контент) Только я почти ничего не понимаю. Например, я хочу обучить, что б она кодила. Что нужно? Какие то примеры из гит хаб, или простые функции?

0

返信
@tetraocean says:

2024年10月21日 at 05:03 Copy Link of a Comment

а что можно обучить на локальном компьютере? chatgpt предлагает использовать Bert для обучение своего ассистента. Можете ли подобное разобрать?

0

返信

@RomaRingo says:

2024年10月21日 at 05:03 Copy Link of a Comment

как сделать чтобы задавать вопросы голосом и получать ответы голосом ?

0

返信
@ДмитрийЛеснов-ч5з says:

2024年10月21日 at 05:03 Copy Link of a Comment

Привет! Спасибо за видео! Чем вы генерировали голос?

0

返信
@alnibl says:

2024年10月21日 at 05:03 Copy Link of a Comment

Здравствуйте! Подскажите пожалуйста, какая лучше модель llm подойдет для задачи вытаскивания из текста названия книги, автора, года и издательства. Текст подается в промте, но он с ошибками и неточностями, так как распознается по фото книги моделью ocr)

0

返信

@pacman777 says:

2024年10月21日 at 05:03 Copy Link of a Comment

привет,
hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?

0

返信
@leoniddzhabiev says:

2024年10月21日 at 05:03 Copy Link of a Comment

спасибо. это нужное видео

0

返信
@ДенисДавыдов-д8ц says:

2024年10月21日 at 05:03 Copy Link of a Comment

Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)

0

返信

@КравчукІгор-т2э says:

2024年10月21日 at 05:03 Copy Link of a Comment

Да это интересно. Спасибо за Вашу работу.

0

返信
@19_xyz says:

2024年10月21日 at 05:03 Copy Link of a Comment

Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?

0

返信
@softgpt says:

2024年10月21日 at 05:03 Copy Link of a Comment

Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка

0

返信

@IT_psychopath says:

2024年10月21日 at 05:03 Copy Link of a Comment

Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе?
Заранее спасибо!

0

返信
@СергейПетров-ц3ъ says:

2024年10月21日 at 05:03 Copy Link of a Comment

Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?

0

返信
@СергейПетров-ц3ъ says:

2024年10月21日 at 05:03 Copy Link of a Comment

Я экспериментировал с Llama 3 7b Q8 на Llama.cpp, так и она и Gemma Q8 болеют словоблудием и после правильного ответа начинают рассказывать всякую дичь или повторяют одно и то же. Иногда даже дополняют мой вопрос своими домыслами и на это уже пытаются ответить, но эта проблема исчезает в интерактивном режиме. И так же эта проблема не актуальна в GPT4ALL. Я думаю, что это можно как-то устранить с помощью правильного подбора параметров –temp и –чего-то-там-repeat

0

返信

@СергейПетров-ц3ъ says:

2024年10月21日 at 05:03 Copy Link of a Comment

Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе – типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b – скидывайте бабосы

0

返信
@ValentinYefimov says:

2024年10月21日 at 05:03 Copy Link of a Comment

Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf

0

返信
@ЛюКан-э7ч says:

2024年10月21日 at 05:03 Copy Link of a Comment

Мужик спасибо. Давно хотел что-то подобное 🔥

0

返信

@goga-pro2024 says:

2024年10月21日 at 05:03 Copy Link of a Comment

да хотим увидеть квантилизацию

0

返信
@snowiedigga says:

2024年10月21日 at 05:03 Copy Link of a Comment

Интересно, продолжай в том же духе 👍

0

返信
@unzerror8208 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Квантизацию модели с последующей конвертацией в GGUF поддерживаю.

0

返信

@noino5458 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?

0

返信
@astrauser-n4x says:

2024年10月21日 at 05:03 Copy Link of a Comment

Хорошее видео, спасибо! Интересно увидеть продолжение видео.

0

返信
@sergeykartyshov2846 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Спасибо, очень интересно. Квантизацию поддерживаю. Интересно познакомиться поближе с библиотекой.

0

返信

@АнтонТай says:

2024年10月21日 at 05:03 Copy Link of a Comment

Добрый день! Было бы очень интересно как вы конвертируете модель в формат для TensorRT и запускаете её, собственно на TensorRT. Особенно интересно было бы измерить прирост в скорости.

0

返信
@newocom says:

2024年10月21日 at 05:03 Copy Link of a Comment

Так, дуже цікаво!

0

返信
@barkalov says:

2024年10月21日 at 05:03 Copy Link of a Comment

Интересно запустить инференс на чем-нибудь вроде Raspberry pi

0

返信

@infomed100 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Квантизацию модели с последующей конвертацией в GGUF поддерживаю!

0

返信
@jonymnimonik-ff7dg says:

2024年10月21日 at 05:03 Copy Link of a Comment

Да , интересно

0

返信
@150vit says:

2024年10月21日 at 05:03 Copy Link of a Comment

Квантизация очень интересна! И не сколько для мобильных устройств, сколько запуск тяжёлых моделей (70-30B) на 24Gb видеокартах, Tesla P40, например. Запуск на нескольких видеокартах, оптимизация под разные архитектуры…

0

返信

@userpupkin499 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Спасибо за видео. Да, интерересно было бы продолжение с получением gguf

0

返信
@Ad-rc4dy says:

2024年10月21日 at 05:03 Copy Link of a Comment

Отличное видео, спасибо!Можете подсказать какие ещё есть популярные датасеты для файнтюнинга кроме Саманты и их предназначение

0

返信
@goradiog8145 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Как обучить whisper? Нигде не могу найти видео на эту тему. Мне постоянно необходимо расшифровывать аудиозаписи в текст. Необученный whisper плохо работает с русским языком. Хотелось бы допилить модель, но не знаю как.

0

返信

@mr.grixakrushkas5667 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Было бы интересно про метрики и сравнение качества моделей, а то на глаз такое себе. Вдруг при обучении она позабыла все.

0

返信
@2009Spread says:

2024年10月21日 at 05:03 Copy Link of a Comment

Сколько ресурсов ест в процессе обучения, и сколько когда модель готова . Есть метрики?

0

返信
@ПетрФомин-щ9ж says:

2024年10月21日 at 05:03 Copy Link of a Comment

Честно говоря я ожидал большего. В начале видоса был радостный возглас: "наконец-то мы получили модель сопоставимую по качеству с GPT-4"!!! Речь шла конечно о Llama-3-70b И потом автор с покер-фейсом просто берёт для своего фантюнинга модель Llama-3-8b-4bit. То есть не только модель в на порядок меньше так ещё и квантизованую по самое нибалуйся. Я ожидал увидеть процесс обучения 70b квантизованой до 8 бит модели на A100 GPU камне и понять примерно сколько времени это может занять. И дообучать чему-то полезному например вопросам и ответам на русском языке. В этом видосе кстати сам процесс обучения скипнут хотя это самое интересное можно было показать минуту начала и минуту конца. Просто так скипать весь процесс это не правильно потому что ради этого процесса все эти подготовительные танцы с бубном и проделывались.

0

返信

@Александр-ь4и2ц says:

2024年10月21日 at 05:03 Copy Link of a Comment

Интересно! И ещё полную подготовку датасета для обучения.
А если обучить на своём датасете по определённому домену, насколько хорошо она будет отвечать по этому домену без подгрузки контекста

0

返信
@kirillkirilenkov9610 says:

2024年10月21日 at 05:03 Copy Link of a Comment

Квантизацию модели с последующей конвертацией в GGUF поддерживаю.

0

返信
@ДмитрийГерасименко-м2е says:

2024年10月21日 at 05:03 Copy Link of a Comment

Было бы ещё Здорово эту модель залить на хостинг через фласк или Джанго чтобы она там отвечала на вопросы,(конечно в закрытом режиме для безопасности) также было бы интересно посмотреть как реализовывается Telegram бот с её помощью, конечно после того как квантизация будет сделана. Думаю что это были бы очень ценные ролики для многих.

0

返信

@MultiAccordionman says:

2024年10月21日 at 05:03 Copy Link of a Comment

Спасибо большое за ролик. Было бы здорово увидеть ролик про квантизацию и разбор Вашей библиотеки.

0

返信

Llama 3 + QLoRA: AI技術の魅力を体験する最新のファインチューニング方法

Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

関連

Written by Ruslan Dev

Unlocking the Power of Local AI Agents: How to Build Your Own Tools with Llama 3 8B!

未来を感じる！AI技術の進化に驚愕。Llama 3が登場するが、その実力はいかに？

Unleashing the Power of LLaMA 3: A Game-Changer in AI Technology

Unleashing the Power of AI: The Ultimate Showdown Between Claude 3 and ChatGPT

Unveiling the Future: How Mark Zuckerberg’s Llama 3, $10B Models, and Caesar Augustus are Revolutionizing AI in 1 GW Datacenters

Unveiling the Future: Meta Announces Llama 3 at Weights & Biases’ Conference

「OpenAI o1の進化を追う：信頼性と安全性の新たなステージに迫る」

Unleashing the Power of AI: The Ultimate Showdown Between Claude 3 and ChatGPT

「ChatGPTがGoogleに挑戦状！革新的な検索機能でインターネットの未来を切り拓く」

「AIが投資委員会に？新しいETFがGPT、Gemini、Claudeを搭載！」

GoogleとTeam USAの新コラボ『Gemini』がAI技術界を席巻！最新情報を一挙公開！

「Z世代がChatGPTを『肌の専門家』として活用中：ブランド戦略に何をもたらす？」

コメントを残すコメントをキャンセル

42 Comments

「AI革命の最前線：技術競争が未来を形作る」

「AppleのAI戦略に迫る試練とチャンス：Siri対ChatGPTの未来図を解き明かす」

「OpenAI o1の進化を追う：信頼性と安全性の新たなステージに迫る」

Unleashing the Power of AI: The Ultimate Showdown Between Claude 3 and ChatGPT

「ChatGPTがGoogleに挑戦状！革新的な検索機能でインターネットの未来を切り拓く」

「AIが投資委員会に？新しいETFがGPT、Gemini、Claudeを搭載！」

GoogleとTeam USAの新コラボ『Gemini』がAI技術界を席巻！最新情報を一挙公開！

「Z世代がChatGPTを『肌の専門家』として活用中：ブランド戦略に何をもたらす？」