Parameter-Efficient Fine-Tuning of Large Language Models

Authors

  • I.V. Babich Donetsk National Technical University
  • K.N. Efimenk Donetsk National Technical University

Keywords:

parameter-efficient fine-tuning, PEFT, LoRA, QLoRA, quantization, Hessian spectrum

Abstract

В статье приведён обзор теоретической основы parameter-efficient fine-tuning (PEFT) для больших языковых моделей (LLM). Рассмотрены ключевые методы низкоранговых адаптаций (LoRA) и их комбинация с низкобитной квантизацией (QLoRA). Дополнительно приведены рекомендации по выбору ранга адаптации и уровня квантизации на основе спектра Гессиана и эффективной размерности задачи. Успешность использования методов PEFT зависит от правильного выбора параметров, прежде всего ранга адаптации и глубины квантизации

Author Biography

K.N. Efimenk, Donetsk National Technical University

кандидат технических наук, доцент, доцент кафедры прикладной математики и искусственного интеллекта факультета интеллектуальных систем и программирования ФГБОУ ВО «Донецкий национальный технический университет».

References

Федяев, О. И. Интеллектуальная систе-ма принятия решений в отделении медицинского учреждения на основе нейросетевых, продукционных и статистических моделей / О. И. Федяев, В. С. Бакаленко // Статистика и Экономика, 2019. – № 16(3). – С. 70-77. – URL: https://doi.org/10.21686/2500-3925-2019-3-70-77

Дворяткина, С. Н. Интеграция фрактальных и нейросетевых технологий в педагогическом контроле и оценке знаний обучаемых / С. Н. Дворяткина // Вестник РУДН. Серия : Психология и педагогика, 2016. - Том. 14. - № 4. – С. 451-465.

Федяев, О. И. Прогнозирование оста-точных знаний студентов по отдельным дисциплинам с помощью нейронных сетей / О. И. Федяев // Известия ЮФУ. Технические науки. – 2016. – С. 122-136.

AI в обучении: на что способны технологии уже сейчас? // EduTech. - 2022. - № 4 [49]. – 60 с.

Струнин, Д. А. Искусственный интеллект в сфере образования / Д. А. Струнин. — Текст : непосредственный // Молодой ученый. — 2023. — № 6 (453). — С. 15-16. — URL: https://moluch.ru/archive/453/99921/

Федяев, О. И. Автоматическая регистра-ция присутствия студентов на учебном занятии с помощью компьютерного зрения / О. И. Федяев, И. А. Коломойцева // XXI Национальная конференция по искусственному интеллекту с международным участием КИИ-2023 (Смоленск, 16-20 октября 2023 г.). Труды конференции. В 2-х томах. Т.1. – Смоленск: Принт-Экспресс, 2023. – С. 294-303.

Портал huggingface.co [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://huggingface.co/docs/text-generation-inference/conceptual/lora. – Загл. с экрана.

Портал huggingface.co [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://huggingface.co/blog/4bit-transformers-bitsandbytes. – Загл. с экрана.

Портал geeksforgeeks.org [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://www.geeksforgeeks.org/what-is-qlora-quantized-low-rank-adapter/. – Загл. С экрана.

Портал ru.wikipedia.org [Электронный ресурс] / Интернет-ресурс. – Режим доступа: https://ru.wikipedia.org.

Published

2025-11-10

How to Cite

Babich И., & Efimenk К. Н. . (2025). Parameter-Efficient Fine-Tuning of Large Language Models. Informatics and Cybernetics, (1 (39), 56–60. Retrieved from https://ojs.donntu.ru/infcyb/article/view/575

Issue

Section

Информатика и вычислительная техника