ajuste de função de tradução simultanea

2025-01-08 13:26:08 -03:00
parent 6a9ba1f087
commit f558542359
3 changed files with 106 additions and 62 deletions
--- a/main.py
+++ b/main.py
@@ -128,12 +128,20 @@ async def transcreve_audios(request: Request):
            # Verificar se timestamps estão habilitados
            use_timestamps = get_config("use_timestamps", "false") == "true"
            storage.add_log("DEBUG", "Informações da mensagem", {
                "from_me": from_me,
                "remote_jid": remote_jid,
                "is_group": is_group
            })
            # Transcrever áudio
            storage.add_log("INFO", "Iniciando transcrição")
            transcription_text, has_timestamps = await transcribe_audio(
                audio_source,
                apikey=apikey,
                remote_jid=remote_jid,
                from_me=from_me,
                use_timestamps=use_timestamps
            )
            # Log do resultado
--- a/services.py
+++ b/services.py
@@ -184,66 +184,89 @@ async def transcribe_audio(audio_source, apikey=None, remote_jid=None, from_me=F
    Returns:
        tuple: (texto_transcrito, has_timestamps)
    """
-    storage.add_log("INFO", "Iniciando processo de transcrição")
+    storage.add_log("INFO", "Iniciando processo de transcrição", {
        "from_me": from_me,
        "remote_jid": remote_jid
    })
    url = "https://api.groq.com/openai/v1/audio/transcriptions"
    groq_key = await get_groq_key()
    groq_headers = {"Authorization": f"Bearer {groq_key}"}
    # Inicializar variáveis
-    language = None
+    contact_language = None
    transcription_language = None
    auto_detected = False
    is_private = remote_jid and "@s.whatsapp.net" in remote_jid
    system_language = redis_client.get("TRANSCRIPTION_LANGUAGE") or "pt"
-    
+    is_private = remote_jid and "@s.whatsapp.net" in remote_jid
-    # Determinar idioma baseado no contexto
+
    # Determinar idioma do contato em conversas privadas
    if is_private:
-        # 1. Verificar configuração manual primeiro
+        # Remover @s.whatsapp.net do ID para buscar no cache
-        manual_language = storage.get_contact_language(remote_jid)
+        contact_id = remote_jid.split('@')[0]
-        if manual_language:
+        
-            language = manual_language
+        # 1. Tentar obter idioma configurado manualmente
-            storage.add_log("DEBUG", "Usando idioma configurado manualmente", {
+        contact_language = storage.get_contact_language(contact_id)
-                "language": manual_language,
+        if contact_language:
            storage.add_log("DEBUG", "Idioma do contato encontrado", {
                "contact_language": contact_language,
                "from_me": from_me,
                "remote_jid": remote_jid,
-                "from_me": from_me
+                "is_private": is_private
            })
        # 2. Se não houver idioma configurado manualmente, verificar cache
        elif storage.get_auto_language_detection():
            cached_lang = storage.get_cached_language(contact_id)
            if cached_lang:
                contact_language = cached_lang.get('language')
                storage.add_log("DEBUG", "Usando idioma em cache", {
                    "contact_language": contact_language,
                    "auto_detected": True
                })
        if not contact_language:
            storage.add_log("DEBUG", "Nenhum idioma configurado para o contato", {
                "from_me": from_me,
                "remote_jid": remote_jid,
                "is_private": is_private,
                "system_language": system_language
            })
    # Definir idioma de transcrição e tradução baseado no contexto
    if is_private and contact_language:
        if from_me:
            # Se estou enviando para um contato com idioma configurado
            transcription_language = contact_language  # Transcrever no idioma do contato
            target_language = contact_language        # Não precisa traduzir
            storage.add_log("DEBUG", "Usando idioma do contato para áudio enviado", {
                "transcription_language": transcription_language,
                "target_language": target_language
            })
        else:
-            # 2. Verificar cache
+            # Se estou recebendo
-            cached_lang = storage.get_cached_language(remote_jid)
+            transcription_language = contact_language  # Transcrever no idioma do contato
-            if cached_lang:
+            target_language = system_language         # Traduzir para o idioma do sistema
-                language = cached_lang['language']
+            storage.add_log("DEBUG", "Processando áudio recebido com tradução", {
-                auto_detected = cached_lang.get('auto_detected', False)
+                "transcription_language": transcription_language,
-                storage.add_log("DEBUG", "Usando idioma em cache", {
+                "target_language": target_language
-                    **cached_lang,
+            })
                    "from_me": from_me
                })
    # Definir idioma para transcrição e tradução
    if from_me and is_private:
        # Se o áudio é meu e destinado a um contato privado:
        # - Transcreve no idioma do sistema
        # - Traduz para o idioma do contato (se configurado)
        transcription_language = system_language
        target_language = language if language else system_language
    else:
-        # Se o áudio é recebido:
+        # Caso padrão: usar idioma do sistema
-        # - Transcreve no idioma detectado/configurado do contato
+        transcription_language = system_language
        # - Traduz para o idioma do sistema
        transcription_language = language if language else system_language
        target_language = system_language
        storage.add_log("DEBUG", "Usando idioma do sistema", {
            "transcription_language": transcription_language,
            "target_language": target_language
        })
    storage.add_log("DEBUG", "Configuração de idiomas definida", {
        "transcription_language": transcription_language,
        "target_language": target_language,
        "from_me": from_me,
        "is_private": is_private,
-        "auto_detected": auto_detected
+        "contact_language": contact_language
    })
    try:
-        # [Código existente para download do áudio se for URL]...
+        # Realizar transcrição
        # Preparar dados para transcrição
        data = aiohttp.FormData()
        data.add_field('file', open(audio_source, 'rb'), filename='audio.mp3')
        data.add_field('model', 'whisper-large-v3')
@@ -267,15 +290,14 @@ async def transcribe_audio(audio_source, apikey=None, remote_jid=None, from_me=F
                # Processar resposta baseado no formato
                transcription = format_timestamped_result(result) if use_timestamps else result.get("text", "")
-                
+
-                # Detecção automática de idioma para novos contatos privados
+                # Detecção automática para novos contatos
                if (is_private and storage.get_auto_language_detection() and 
-                    not from_me and not manual_language and not cached_lang):
+                    not from_me and not contact_language):
                    try:
                        detected_lang = await detect_language(transcription)
                        storage.cache_language_detection(remote_jid, detected_lang)
-                        auto_detected = True
+                        contact_language = detected_lang
                        language = detected_lang
                        storage.add_log("INFO", "Idioma detectado e cacheado", {
                            "language": detected_lang,
                            "remote_jid": remote_jid
@@ -283,14 +305,14 @@ async def transcribe_audio(audio_source, apikey=None, remote_jid=None, from_me=F
                    except Exception as e:
                        storage.add_log("WARNING", "Erro na detecção de idioma", {"error": str(e)})
-                # Tradução automática
+                # Tradução quando necessário
-                need_translation = False
+                need_translation = (
-                if from_me and is_private and language:
+                    is_private and contact_language and
-                    # Se for meu áudio para um contato, traduz para o idioma do contato
+                    (
-                    need_translation = transcription_language != target_language
+                        (from_me and transcription_language != target_language) or
-                elif not from_me and storage.get_auto_translation():
+                        (not from_me and target_language != transcription_language)
-                    # Se for áudio recebido e tradução automática ativada, traduz para idioma do sistema
+                    )
-                    need_translation = language != system_language
+                )
                if need_translation:
                    try:
@@ -301,17 +323,17 @@ async def transcribe_audio(audio_source, apikey=None, remote_jid=None, from_me=F
                        )
                        storage.add_log("INFO", "Texto traduzido automaticamente", {
                            "from": transcription_language,
-                            "to": target_language,
+                            "to": target_language
                            "from_me": from_me
                        })
                    except Exception as e:
                        storage.add_log("ERROR", "Erro na tradução", {"error": str(e)})
-                # Registrar estatísticas
+                # Registrar estatísticas de uso
                used_language = contact_language if contact_language else system_language
                storage.record_language_usage(
-                    language if language else system_language,
+                    used_language,
                    from_me,
-                    auto_detected
+                    bool(contact_language and contact_language != system_language)
                )
                return transcription, use_timestamps
@@ -329,8 +351,7 @@ async def transcribe_audio(audio_source, apikey=None, remote_jid=None, from_me=F
                os.unlink(audio_source)
            except Exception as e:
                storage.add_log("WARNING", "Erro ao remover arquivo temporário", {
-                    "error": str(e),
+                    "error": str(e)
                    "file": audio_source
                })
 def format_timestamped_result(result):
--- a/storage.py
+++ b/storage.py
@@ -295,6 +295,11 @@ class StorageHandler:
            auto_detected: Se o idioma foi detectado automaticamente
        """
        try:
            # Validar idioma
            if not language:
                self.add_log("WARNING", "Tentativa de registrar uso sem idioma definido")
                return
            # Incrementar contagem total do idioma
            self.redis.hincrby(
                self._get_redis_key("language_stats"),
@@ -303,9 +308,10 @@ class StorageHandler:
            )
            # Incrementar contagem por direção (enviado/recebido)
            direction = 'sent' if from_me else 'received'
            self.redis.hincrby(
                self._get_redis_key("language_stats"),
-                f"{language}_{'sent' if from_me else 'received'}",
+                f"{language}_{direction}",
                1
            )
@@ -324,9 +330,18 @@ class StorageHandler:
                datetime.now().isoformat()
            )
-        except Exception as e:
+            # Log detalhado
-            self.logger.error(f"Erro ao registrar uso de idioma: {e}")
+            self.add_log("DEBUG", "Uso de idioma registrado", {
                "language": language,
                "direction": direction,
                "auto_detected": auto_detected
            })
        except Exception as e:
            self.add_log("ERROR", "Erro ao registrar uso de idioma", {
                "error": str(e),
                "type": type(e).__name__
            })
    def get_language_statistics(self) -> Dict:
        """
        Obtém estatísticas de uso de idiomas