تخطي إلى التنقل الرئيسي تخطي إلى البحث تخطي إلى المحتوى الرئيسي

StableYolo: Optimizing Image Generation for Large Language Models

  • Harel Berger
  • , Aidan Dakhama
  • , Zishuo Ding
  • , Karine Even-Mendoza
  • , David Kelly
  • , Hector Menendez
  • , Rebecca Moussa
  • , Federica Sarro

نتاج البحث: فصل من :كتاب / تقرير / مؤتمرمنشور من مؤتمرمراجعة النظراء

6 اقتباسات (Scopus)

ملخص

AI-based image generation is bounded by system parameters and the way users define prompts. Both prompt engineering and AI tuning configuration are current open research challenges and they require a significant amount of manual effort to generate good quality images. We tackle this problem by applying evolutionary computation to Stable Diffusion, tuning both prompts and model parameters simultaneously. We guide our search process by using Yolo. Our experiments show that our system, dubbed StableYolo, significantly improves image quality (52% on average compared to the baseline), helps identify relevant words for prompts, reduces the number of GPU inference steps per image (from 100 to 45 on average), and keeps the length of the prompt short (≈ 7 keywords).

اللغة الأصليةالإنجليزيّة
عنوان منشور المضيفSearch-Based Software Engineering - 15th International Symposium, SSBSE 2023, Proceedings
المحررونPaolo Arcaini, Tao Yue, Erik M. Fredericks
ناشرSpringer Science and Business Media Deutschland GmbH
الصفحات133-139
عدد الصفحات7
رقم المعيار الدولي للكتب (المطبوع)9783031487958
المعرِّفات الرقمية للأشياء
حالة النشرنُشِر - 2024
منشور خارجيًانعم
الحدث15th International Symposium on Search-Based Software Engineering, SSBSE 2023 - San Francisco, الولايات المتّحدة
المدة: 8 ديسمبر 20238 ديسمبر 2023

سلسلة المنشورات

الاسمLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
مستوى الصوت14415 LNCS
رقم المعيار الدولي للدوريات (المطبوع)0302-9743
رقم المعيار الدولي للدوريات (الإلكتروني)1611-3349

!!Conference

!!Conference15th International Symposium on Search-Based Software Engineering, SSBSE 2023
الدولة/الإقليمالولايات المتّحدة
المدينةSan Francisco
المدة8/12/238/12/23

بصمة

أدرس بدقة موضوعات البحث “StableYolo: Optimizing Image Generation for Large Language Models'. فهما يشكلان معًا بصمة فريدة.

قم بذكر هذا