Jak przygotować materiały do chatbota wykorzystującego LLM?

    Poniższa rozpiska przygotowana została w czerwcu 2024 i obowiązuje na aktualnie wykorzystywane modele językowe. Ze względu na ich niezwykle szybki rozwój – lista może ulegać aktualizacjom.

    Zdefiniuj swoje cele

    Zacznij od jasnego określenia swojego problemu i zrozumienia oczekiwanych wyników, które chcesz uzyskać od swojego chatbota AI oraz odbiorców rozwiązania.

    Zbierz kluczowe dane

    Zgromadź niezbędne terminy, zasady i parametry potrzebne do efektywnego działania twojego chatbota AI, takie jak feedy produktowe, dane z ankiet, instrukcje i podręczniki
    lub specyficzną terminologię branżową. 

    Kształtuj swoje materiały

    • najlepsze formaty to: .docx, .doc. PDF-y mogą być problematyczne, ponieważ mogą zawierać tekst osadzony w różnych formatach, takich jak obrazy czy grafiki wektorowe (złożone układy i warstwy, wiele kolumn, nieregularne formatowanie lub treści bogate w obrazy utrudniają LLM zrozumienie kontekstu informacji) –
      im prostszy format do odczytu, tym lepsze efekty osiągniemy;
    • bezpośrednie integracje z BigQuery (soon), systemami CRM (soon), bazami wiedzy pozwalają na automatyczne aktualizacje (miej pewność, że dane tam są uporządkowane). Pamiętaj, że LLM nie zaciąga do swojej wiedzy treści zawartych
      w dodatkowych załącznikach, a tylko te treści, które są bezpośrednio w bazie. Załączniki mogą być przykazywane w postaci np. linków;
    • bazy danych produktów: dostępne np. w formatach XML czy CSV, pozwalają
      na zaciągnięcie do bazy automatycznie aktualizowanych list produktów.

      Uporządkuj treści

      • Wyeliminuj duplikaty i treści, które mogą zaburzać jasność odpowiedzi bota, dokonaj korekty błędów, uzupełnij brakujące dane i zwróć uwagę, czy treści
        w różnych materiałach się nie wykluczają, są zwięzłe i na temat. 
      • Jeżeli istnieje kontekst danej odpowiedzi – np. sposób resetowania hasła różni
        się w zależności od tego, czy ktoś pamięta adres e-mail, czy nie – dodaj go
        do odpowiedzi. 
      • Jeśli w Twoich materiałach pojawiają się tabele, upewnij się, że sposób ich opisania jest zrozumiały także dla człowieka – jeśli tak nie będzie, utrudni
        to ich poprawne zaimplementowanie i sprawdzenie poprawności interpretacji.
      • Im prostszy język, więcej konkretów (bez możliwości na interpretacje bota), tym lepiej, a im wyższej jakości będzie wkład, który wprowadzimy do chatbota, tym lepsze wyniki będzie pokazywał.

      Organizuj dla efektywności

      • kategoryzacja tematyczna (np. zarządzanie kontem, wnioski kredytowe), 
      • kategoryzacja na podstawie intencji (np. rozwiązywanie problemów),
      • kolejność chronologiczna (organizowanie według czasowej wrażliwości),
      • kolejność kontekstowa (organizowanie według przepływu konwersacji).
        Spis treści