
Jak stworzyć agenta głosowego, który działa - i jak uniknąć typowych błędów
Zajmuję się konfiguracją agentów głosowych na co dzień. Przez ten czas widziałem te same błędy dziesiątki razy. Oto co naprawdę ma znaczenie.
Większość agentów, które „nie działają", wcale nie ma problemu z Agentem. Ma problem z ustawieniami. Agent AI ma gigantyczne możliwości — ale sam z siebie nie wie, co ma zrobić. Jeżeli nie powiecie mu, jak obsługiwać klientów, jak rozwiązywać problemy i do czego dążyć w rozmowie — zrobi to po swojemu. A to trochę jak obsługa klienta przez kogoś, kto gdzieś kiedyś słyszał o obsłudze klienta, ale niekoniecznie u Was.
Jeżeli agent nie działa, najpierw szukam problemu w ustawieniach — nie w tym, że mój genialny scenariusz obsługi jest nieobsługiwany przez narzędzie.
Żeby pokazać konkretnie jak ustawienia wpływają na działania agenta, opiszę wam dwóch agentów. Jeden — nazwijmy go Lucky — skonfigurowany świadomie i dokładnie. Drugi — Unlucky — potraktowany trochę z mniejszą miłością. Generyczny prompt, wielka baza wiedzy bez struktury, brak testów. Lecimy na produkcję.
Poniżej pięć różnic, które dzielą tych dwóch agentów - a co za tym idzie 5 błędów, które najczęściej widzę w ustawieniach agentów.
Błąd #1 Prompt bez celu to przepis na agenta-encyklopedię
Zacznijmy od tożsamości agenta w prompcie. Unlucky dostał taki opis:
Unlucky
„Jesteś profesjonalnym asystentem AI, którego zadaniem jest udzielanie informacji użytkownikowi na temat oferty i odpowiadanie na pytania w sposób dokładny i wyczerpujący."
Lucky
„Jesteś pomocnym, konkretnym i naturalnym asystentem głosowym. Twoim celem jest prowadzenie rozmowy w sposób prosty i zrozumiały oraz doprowadzenie użytkownika do kolejnego kroku."
Na pierwszy rzut oka Unlucky brzmi spoko. Profesjonalny, dokładny — czego chcieć więcej? No właśnie.
Oto fragment rozmowy Agenta Unlucky:
- Klient: Nie rozumiem waszej oferty, czy możesz mi pomóc?"
- Agenta Unlucky „Nasza firma oferuje zaawansowane rozwiązania oparte na sztucznej inteligencji, które wspierają procesy komunikacyjne i sprzedażowe w organizacjach."
- Klient „Okej... ale co to znaczy?"
- Agenta Unlucky „Rozwiązanie może być wykorzystywane w różnych obszarach działalności w zależności od potrzeb biznesowych."
Odpowiedział. Zgodnie z prawdą. Ale nie zapewnił niczego, czego chcielibyśmy. Lucky, z dwoma dodatkowymi linijkami w prompcie, na to samo pytanie:
- Agent Lucky „Jasne. W skrócie — agent głosowy rozmawia z twoimi klientami zamiast człowieka, albo wspiera obsługę zespołu."
- Klient „A co konkretnie może robić?"
- Lucky „Pełna obsługa dzwoniących, odbieranie telefonów, kwalifikowanie leadów, zbieranie potrzebnych informacji. Jeśli chcesz, przygotuję dla ciebie przykład."
Różnica w tekście: dosłownie dwie linijki. Różnica w działaniu: ogromna. Kluczowe słowa w prompcie Lucky'ego to „doprowadzenie do kolejnego kroku". Bez tego agent będzie mówić. Z tym — będzie działać.
Pytanie, które warto zadać sobie przed napisaniem promptu: Co jest sukcesem tej rozmowy? Umówione demo? Zebrane dane? Klient, który wie, co zrobić dalej?
Bez odpowiedzi na to pytanie agent będzie sam sobie wymyślał cel — i niekoniecznie będzie to wasz cel.
Błąd #2 Brak flow rozmowy
Unlucky dostał instrukcje, które brzmią rozsądnie:
- „Odpowiadaj szczegółowo i kompleksowo",
- „Wyjaśniaj wszystkie aspekty tematu",
- „Nie skracaj odpowiedzi kosztem dokładności".
Wynik? Ktoś chce umówić demo:
- Unlucky„ Oczywiście, demo umożliwia zapoznanie się z funkcjonalnościami naszego rozwiązania oraz jego potencjalnymi zastosowaniami. Proszę o kontakt z naszym działem sprzedaży."
Obsłużył. Odpowiedział. Rozmowa zakończona. Tylko że klient teraz sam musi szukać kontaktu do działu sprzedaży. A Lucky?
- Lucky: Super, to słyszeć! Świetny wybór. Znajdźmy termin, który ci pasuje — wolisz spotkanie jeszcze dziś, czy może inny dzień?"
- Klient: „Jutro."
- Lucky: „Świetnie, celujemy w jutro. Interesuje cię konkretna godzina, czy zostawiasz to nam?"
Jaka była różnica? Lucky dostał instrukcję: „Zawsze staraj się wykonać kolejny krok w rozmowie". To wystarczyło. Nie skomplikowane scenariusze, nie rozbudowane drzewa decyzyjne — jedno zdanie w prompcie zmieniło wszystko.
Dobry flow rozmowy to minimum: powitanie → kwalifikacja → akcja. Jeśli nie podamy agentowi tej struktury, sam sobie ją wymyśli. I będzie to rozmowa. Fajna rozmowa. Ale bez kolejnego kroku.
Błąd #3 Korporacyjna persona zamiast prawdziwego rozmówcy
Tutaj nie chodzi o tożsamość, tylko o to jak agent prowadzi rozmowę. Unlucky: formalny profesjonalny język, pełne rozbudowane zdania, unika potocznych zwrotów, brzmi jak ekspert. Wszystko pięknie. Tyle że w praktyce wygląda to tak:
- Klient: „Za drogo."
- Unlucky: „Cena rozwiązania zależy od wielu czynników, takich jak zakres wdrożenia oraz indywidualne potrzeby klienta."
I tyle. Klient się rozłącza.
Lucky został skonfigurowany tak, żeby mówić naturalnie jak konsultant, używać prostego języka, brzmieć pomocnie, ale nienachalnie. Jego odpowiedź na argument “za drogo’?
- Lucky: „Jasne, to zrozumiała wątpliwość. Chodzi o konkretny budżet, czy raczej o faktyczne przełożenie tej inwestycji na wasze wyniki i zadowolenie klientów?"
- Klient: „ No... bardziej to drugie."
- Lucky: „Z tym mogę ci pomóc. Powiedz mi więcej o swoim use casie, to pokażę wpływ rozwiązania na konkretnym przykładzie."
Lucky nie tylko przyjął obiekcję — zebrał informacje dla handlowca, który przejmie ten kontakt. Unlucky był Wikipedią firmy. Lucky był rozmówcą.
Błąd #4 Fallbacki, czyli ile warte są dla ciebie twoje leady?
90% dzwoniących to nie są idealni klienci ze scenariusza. Ktoś jest niezdecydowany. Ktoś nie wie czego chce. Ktoś mówi „nie wiem, czy to dla mnie". Ktoś woli jednak pogadać z człowiekiem.
Taki reaguje agent bez dodanych fallbacków na hasło klienta „Nie wiem, czy to dla mnie."
- Unlucky: „Rozwiązanie może być stosowane w różnych branżach i przypadkach użycia."
To by było na tyle jeśli chodzi o tę rozmowę.
Lucky ma instrukcję: zadaj jedno konkretne pytanie, żeby pchnąć rozmowę dalej. Pytania mają być proste i zamknięte — tak/nie, konkretny wybór. Nie ogólne „opowiedz mi o swoich potrzebach". Jego odpowiedź na wahanie klienta:
- Lucky: „Możemy to szybko sprawdzić. Powiedz mi — masz więcej zapytań przychodzących od klientów, czy robisz raczej outbound?"
- Klient: „Raczej inbound."
- Lucky: „To brzmi jak dobry fit. Możemy automatyzować odbieranie rozmów i dostosować agenta dokładnie pod wasze potrzeby."
Agent Lucky jest skonfigurowany pod konkretnego klienta, więc jego głos i tempo mogą nie pasować do każdego use case'u — to jasne. Ale zasada jest prosta: dobry agent poradzi sobie w każdej niestandardowej sytuacji, bo ma zaplanowane co robić. Kiepski agent będzie mówić to samo niezależnie od kontekstu.
Błąd #5: Długość wypowiedzi — im dłużej mówisz, tym szybciej tracisz rozmówcę (nawet jeśli jesteś AI)
To błąd, który widzę najczęściej u nowych klientów. I jest pozornie trywialny. Unlucky na pytanie „jak to działa?" — pełna wypowiedź, 22 sekundy, prawdziwe informacje, zero call for action na końcu.
Lucky, to samo pytanie:
- Lucky: „Najkrócej jak się da — agent głosowy odbiera połączenie i obsługuje zapytanie. Rodzaj tej obsługi zależy od ciebie: zbieranie danych, filtrowanie połączeń, przekazywanie do właściwego zespołu zamiast męczących centralek. Chcesz zobaczyć to na przykładzie?"
Krótko, konkretnie, i na końcu pytanie. To nie jest kwestia tego, jaki silnik wybrałeś ani jak zaawansowany jest model. To wyłącznie kwestia ustawień.
Im dłużej agent mówi, tym szybciej traci uwagę rozmówcy. W rozmowie telefonicznej klient nie może przewinąć wstecz. Jeśli zgubił wątek — po prostu się rozłącza.
Lista kontrolna — sprawdź to zanim agent trafi na produkcję
Często testujemy agenta raz, on odebrał, przedstawił się jak chcieliśmy, wiedział odpowiedź na jedno konkretne pytanie — i lecimy. Tak naprawdę warto przetestować co najmniej pięć realnych scenariuszy. Zapytajcie zespół jakie telefony mieli w ubiegłym tygodniu. To są wasze testy.
A przed testami warto się upewnić, że te rzeczy są w ogóle zaadresowane:
- Cel rozmowy — czy agent wie co jest sukcesem? Czy ma zdefiniowany next step, do którego dąży?
- Flow rozmowy — czy jest struktura: powitanie → kwalifikacja → akcja? Czy agent aktywnie prowadzi rozmówcę do przodu?
- Konkretne instrukcje — czy prompt zawiera przykłady? Czy agent wie czego ma NIE robić (np. nie podawać konkretnych wycen)?
- Styl i ton — czy ma brzmieć jak konsultant czy jak encyklopedia? Czy to jest jasno opisane w prompcie?
- Fallbacki — co gdy klient jest niezdecydowany, nic nie mówi, zmienia temat, chce rozmawiać z człowiekiem?
- Długość odpowiedzi — czy mamy ustawiony limit? Czy odpowiedzi kończą się pytaniem lub action pointem?
- Baza wiedzy — czy jest skupiona i poukładana? Więcej nie znaczy lepiej. Struktura znaczy lepiej.
- Testy głosowe — czy głos agenta pasuje do marki? Czy tempo jest okej? Sprawdźcie to, zanim sprawdzą klienci.
Na koniec
Jeżeli jest jedna rzecz, którą chciałbym żebyście zapamiętali z tego artykułu, to ta:
Różnica między agentem, który działa, a tym, który nie działa, nie leży w AI. Leży wyłącznie w konfiguracji.
Agent głosowy to narzędzie. Świetne narzędzie, naprawdę polecam — inaczej bym się nim nie zajmował. Ale jak każde narzędzie, wymaga tego, żebyś wiedział po co go używasz i żebyś go odpowiednio skonfigurował.
Zatrudniając nową osobę do odbierania telefonów, nie mówisz jej po prostu „odbieraj i odpowiadaj na pytania". Mówisz: jeśli dzwoni pani Kasia z firmy X — połącz ją z Marysią. Jeśli pyta o cenę — powiedz że wrócimy z wyceną. Jeśli nie wie czego chce — zapytaj o to i to. Tą karteczką z instrukcjami jest właśnie prompt.
Trzeba napisać go świadomie.
Wypróbuj wszystkie funkcje CallPage za darmo przez 14 dni!
Zacznij generować leady sprzedażowe już dzisiaj.
Przetestuj CallPage bezpłatnie i otrzymuj więcej kontaktów bez dodatkowych inwestycji w reklamę.
- Kup lub anuluj w dowolnym momencie
- Szybka konfiguracja
- Plany dopasowane do wielkości firmy