Baza wiedzy
Jak przygotować materiały do chatbota wykorzystującego LLM?
Poniższa rozpiska przygotowana została w czerwcu 2024 i obowiązuje na aktualnie wykorzystywane modele językowe. Ze względu na ich niezwykle szybki rozwój – lista może ulegać aktualizacjom.
Zdefiniuj swoje cele
Zacznij od jasnego określenia swojego problemu i zrozumienia oczekiwanych wyników, które chcesz uzyskać od swojego chatbota AI oraz odbiorców rozwiązania.
Zbierz kluczowe dane
Zgromadź niezbędne terminy, zasady i parametry potrzebne do efektywnego działania twojego chatbota AI, takie jak feedy produktowe, dane z ankiet, instrukcje i podręczniki
lub specyficzną terminologię branżową.
Kształtuj swoje materiały
- najlepsze formaty to: .docx, .doc. PDF-y mogą być problematyczne, ponieważ mogą zawierać tekst osadzony w różnych formatach, takich jak obrazy czy grafiki wektorowe (złożone układy i warstwy, wiele kolumn, nieregularne formatowanie lub treści bogate w obrazy utrudniają LLM zrozumienie kontekstu informacji) –
im prostszy format do odczytu, tym lepsze efekty osiągniemy; - bezpośrednie integracje z BigQuery (soon), systemami CRM (soon), bazami wiedzy pozwalają na automatyczne aktualizacje (miej pewność, że dane tam są uporządkowane). Pamiętaj, że LLM nie zaciąga do swojej wiedzy treści zawartych
w dodatkowych załącznikach, a tylko te treści, które są bezpośrednio w bazie. Załączniki mogą być przykazywane w postaci np. linków; - bazy danych produktów: dostępne np. w formatach XML czy CSV, pozwalają
na zaciągnięcie do bazy automatycznie aktualizowanych list produktów.
Uporządkuj treści
- Wyeliminuj duplikaty i treści, które mogą zaburzać jasność odpowiedzi bota, dokonaj korekty błędów, uzupełnij brakujące dane i zwróć uwagę, czy treści
w różnych materiałach się nie wykluczają, są zwięzłe i na temat. - Jeżeli istnieje kontekst danej odpowiedzi – np. sposób resetowania hasła różni
się w zależności od tego, czy ktoś pamięta adres e-mail, czy nie – dodaj go
do odpowiedzi. - Jeśli w Twoich materiałach pojawiają się tabele, upewnij się, że sposób ich opisania jest zrozumiały także dla człowieka – jeśli tak nie będzie, utrudni
to ich poprawne zaimplementowanie i sprawdzenie poprawności interpretacji. - Im prostszy język, więcej konkretów (bez możliwości na interpretacje bota), tym lepiej, a im wyższej jakości będzie wkład, który wprowadzimy do chatbota, tym lepsze wyniki będzie pokazywał.
Organizuj dla efektywności
- kategoryzacja tematyczna (np. zarządzanie kontem, wnioski kredytowe),
- kategoryzacja na podstawie intencji (np. rozwiązywanie problemów),
- kolejność chronologiczna (organizowanie według czasowej wrażliwości),
- kolejność kontekstowa (organizowanie według przepływu konwersacji).