feat(chat): add LLM-powered travel agent with multi-provider support

Implement a full chat-based travel agent using LiteLLM for multi-provider LLM support (OpenAI, Anthropic, Gemini, Ollama, Groq, Mistral, etc.). Backend: - New 'chat' Django app with ChatConversation and ChatMessage models - Streaming SSE endpoint via StreamingHttpResponse - 5 agent tools: search_places, list_trips, get_trip_details, add_to_itinerary, get_weather - LiteLLM client wrapper with per-user API key retrieval - System prompt with user preference context injection Frontend: - New /chat route with full-page chat UI (DaisyUI + Tailwind) - Collapsible conversation sidebar with CRUD - SSE streaming response display with tool call visualization - Provider selector dropdown - SSE proxy fix to stream text/event-stream without buffering - Navbar link and i18n keys
2026-03-08 18:44:44 +00:00
parent d4e0ef14b8
commit 757140ec70
20 changed files with 1518 additions and 6 deletions
--- a/backend/server/chat/views.py
+++ b/backend/server/chat/views.py
@@ -0,0 +1,260 @@
+import asyncio
+import json
+
+from asgiref.sync import sync_to_async
+from django.http import StreamingHttpResponse
+from rest_framework import status, viewsets
+from rest_framework.decorators import action
+from rest_framework.permissions import IsAuthenticated
+from rest_framework.response import Response
+
+from .agent_tools import AGENT_TOOLS, execute_tool, serialize_tool_result
+from .llm_client import get_system_prompt, stream_chat_completion
+from .models import ChatConversation, ChatMessage
+from .serializers import ChatConversationSerializer
+
+
+class ChatViewSet(viewsets.ModelViewSet):
+    serializer_class = ChatConversationSerializer
+    permission_classes = [IsAuthenticated]
+
+    def get_queryset(self):
+        return ChatConversation.objects.filter(user=self.request.user).prefetch_related(
+            "messages"
+        )
+
+    def list(self, request, *args, **kwargs):
+        conversations = self.get_queryset().only("id", "title", "updated_at")
+        data = [
+            {
+                "id": str(conversation.id),
+                "title": conversation.title,
+                "updated_at": conversation.updated_at,
+            }
+            for conversation in conversations
+        ]
+        return Response(data)
+
+    def create(self, request, *args, **kwargs):
+        conversation = ChatConversation.objects.create(
+            user=request.user,
+            title=(request.data.get("title") or "").strip(),
+        )
+        serializer = self.get_serializer(conversation)
+        return Response(serializer.data, status=status.HTTP_201_CREATED)
+
+    def _build_llm_messages(self, conversation, user):
+        messages = [{"role": "system", "content": get_system_prompt(user)}]
+        for message in conversation.messages.all().order_by("created_at"):
+            payload = {
+                "role": message.role,
+                "content": message.content,
+            }
+            if message.role == "assistant" and message.tool_calls:
+                payload["tool_calls"] = message.tool_calls
+            if message.role == "tool":
+                payload["tool_call_id"] = message.tool_call_id
+                payload["name"] = message.name
+            messages.append(payload)
+        return messages
+
+    def _async_to_sync_generator(self, async_gen):
+        loop = asyncio.new_event_loop()
+        try:
+            while True:
+                try:
+                    yield loop.run_until_complete(async_gen.__anext__())
+                except StopAsyncIteration:
+                    break
+        finally:
+            loop.run_until_complete(loop.shutdown_asyncgens())
+            loop.close()
+
+    @staticmethod
+    def _merge_tool_call_delta(accumulator, tool_calls_delta):
+        for idx, tool_call in enumerate(tool_calls_delta or []):
+            while len(accumulator) <= idx:
+                accumulator.append(
+                    {
+                        "id": None,
+                        "type": "function",
+                        "function": {"name": "", "arguments": ""},
+                    }
+                )
+
+            current = accumulator[idx]
+            if tool_call.get("id"):
+                current["id"] = tool_call.get("id")
+            if tool_call.get("type"):
+                current["type"] = tool_call.get("type")
+
+            function_data = tool_call.get("function") or {}
+            if function_data.get("name"):
+                current["function"]["name"] = function_data.get("name")
+            if function_data.get("arguments"):
+                current["function"]["arguments"] += function_data.get("arguments")
+
+    @action(detail=True, methods=["post"])
+    def send_message(self, request, pk=None):
+        conversation = self.get_object()
+        user_content = (request.data.get("message") or "").strip()
+        if not user_content:
+            return Response(
+                {"error": "message is required"},
+                status=status.HTTP_400_BAD_REQUEST,
+            )
+
+        provider = (request.data.get("provider") or "openai").strip().lower()
+
+        ChatMessage.objects.create(
+            conversation=conversation,
+            role="user",
+            content=user_content,
+        )
+        conversation.save(update_fields=["updated_at"])
+
+        if not conversation.title:
+            conversation.title = user_content[:120]
+            conversation.save(update_fields=["title", "updated_at"])
+
+        llm_messages = self._build_llm_messages(conversation, request.user)
+
+        async def event_stream():
+            current_messages = list(llm_messages)
+            encountered_error = False
+
+            while True:
+                content_chunks = []
+                tool_calls_accumulator = []
+
+                async for chunk in stream_chat_completion(
+                    request.user,
+                    current_messages,
+                    provider,
+                    tools=AGENT_TOOLS,
+                ):
+                    if not chunk.startswith("data: "):
+                        yield chunk
+                        continue
+
+                    payload = chunk[len("data: ") :].strip()
+                    if payload == "[DONE]":
+                        continue
+
+                    yield chunk
+
+                    try:
+                        data = json.loads(payload)
+                    except json.JSONDecodeError:
+                        continue
+
+                    if data.get("error"):
+                        encountered_error = True
+                        break
+
+                    if data.get("content"):
+                        content_chunks.append(data["content"])
+
+                    if data.get("tool_calls"):
+                        self._merge_tool_call_delta(
+                            tool_calls_accumulator,
+                            data["tool_calls"],
+                        )
+
+                if encountered_error:
+                    break
+
+                assistant_content = "".join(content_chunks)
+
+                if tool_calls_accumulator:
+                    assistant_with_tools = {
+                        "role": "assistant",
+                        "content": assistant_content,
+                        "tool_calls": tool_calls_accumulator,
+                    }
+                    current_messages.append(assistant_with_tools)
+
+                    await sync_to_async(
+                        ChatMessage.objects.create, thread_sensitive=True
+                    )(
+                        conversation=conversation,
+                        role="assistant",
+                        content=assistant_content,
+                        tool_calls=tool_calls_accumulator,
+                    )
+                    await sync_to_async(conversation.save, thread_sensitive=True)(
+                        update_fields=["updated_at"]
+                    )
+
+                    for tool_call in tool_calls_accumulator:
+                        function_payload = tool_call.get("function") or {}
+                        function_name = function_payload.get("name") or ""
+                        raw_arguments = function_payload.get("arguments") or "{}"
+
+                        try:
+                            arguments = json.loads(raw_arguments)
+                        except json.JSONDecodeError:
+                            arguments = {}
+                        if not isinstance(arguments, dict):
+                            arguments = {}
+
+                        result = await sync_to_async(
+                            execute_tool, thread_sensitive=True
+                        )(
+                            function_name,
+                            request.user,
+                            **arguments,
+                        )
+                        result_content = serialize_tool_result(result)
+
+                        current_messages.append(
+                            {
+                                "role": "tool",
+                                "tool_call_id": tool_call.get("id"),
+                                "name": function_name,
+                                "content": result_content,
+                            }
+                        )
+
+                        await sync_to_async(
+                            ChatMessage.objects.create, thread_sensitive=True
+                        )(
+                            conversation=conversation,
+                            role="tool",
+                            content=result_content,
+                            tool_call_id=tool_call.get("id"),
+                            name=function_name,
+                        )
+                        await sync_to_async(conversation.save, thread_sensitive=True)(
+                            update_fields=["updated_at"]
+                        )
+
+                        tool_event = {
+                            "tool_result": {
+                                "tool_call_id": tool_call.get("id"),
+                                "name": function_name,
+                                "result": result,
+                            }
+                        }
+                        yield f"data: {json.dumps(tool_event)}\n\n"
+
+                    continue
+
+                await sync_to_async(ChatMessage.objects.create, thread_sensitive=True)(
+                    conversation=conversation,
+                    role="assistant",
+                    content=assistant_content,
+                )
+                await sync_to_async(conversation.save, thread_sensitive=True)(
+                    update_fields=["updated_at"]
+                )
+                yield "data: [DONE]\n\n"
+                break
+
+        response = StreamingHttpResponse(
+            streaming_content=self._async_to_sync_generator(event_stream()),
+            content_type="text/event-stream",
+        )
+        response["Cache-Control"] = "no-cache"
+        response["X-Accel-Buffering"] = "no"
+        return response