Resoluções — Introdução: Tecnologia e Inovação na Medicina (Turma B)

Este arquivo destina-se exclusivamente ao uso do professor. Ele contém as resoluções comentadas das três atividades da Turma B, com orientações pedagógicas detalhadas, indicações dos pontos de maior dificuldade esperada pelos estudantes e roteiros para a condução da discussão coletiva em sala. Não distribua este arquivo aos estudantes antes ou durante a realização das atividades.

Atividade 1 — Resolução

Resolução modelo

O estetoscópio e o prontuário eletrônico parecem, à primeira vista, instrumentos de naturezas completamente distintas — um pertence ao século XIX, o outro ao século XXI; um é mecânico e analógico, o outro é digital e conectado em rede. No entanto, submetidos ao argumento de que a tecnologia médica nunca é neutra, os dois instrumentos revelam uma estrutura comum profundamente reveladora: ambos reorganizaram a autoridade diagnóstica, tornaram invisíveis as dimensões do cuidado que transformaram, e encontraram resistências que, embora tenham sido historicamente chamadas de conservadoras, carregavam conteúdo epistemológico legítimo que o entusiasmo inicial com a inovação não soube reconhecer.

O estetoscópio de Laennec, ao interpor um tubo entre o ouvido do médico e o corpo do paciente, fez muito mais do que ampliar o som. Ele reconfigurou o próprio conceito de evidência clínica. Antes dele, o exame físico era um evento integrado: o médico colocava as mãos sobre o tórax, observava a coloração da pele, sentia o calor corporal, usava o olfato, percebia a respiração com os olhos e com o contato direto, e conversava enquanto examinava. A totalidade desse encontro — sensorial, relacional, gestual — era o diagnóstico. O estetoscópio deslocou a autoridade diagnóstica para um único canal: o som interno mediado pelo instrumento. Implicitamente, ele pressupôs que os sons produzidos pelo coração e pulmões constituem evidência clínica válida independente, e independente também da relação interpessoal que antes era constitutiva do ato de examinar.

As resistências iniciais ao estetoscópio não eram, portanto, apenas a reação corporativa de médicos mais velhos que temiam o novo. Tinham conteúdo epistemológico real. O médico que argumentava que o instrumento “interpunha uma barreira” entre ele e o paciente estava descrevendo com precisão o que acontecia: o instrumento criava uma mediação entre dois seres humanos que, antes, se tocavam. O exame físico direto não era apenas um método diagnóstico — era um ato de presença e de reconhecimento do sofrimento do outro. Ao reduzir o diagnóstico ao que é audível pelo tubo, o estetoscópio silenciava dimensões do corpo que o contato direto acessava. A crítica de que ele esvaziava o exame físico era tecnicamente equivocada em relação ao que o instrumento podia fazer — mas era epistemologicamente perspicaz em relação ao que ele fazia ao encontro clínico como um todo.

O que tornou o estetoscópio definitivamente vitorioso não foi a prova de que essas críticas eram infundadas. Foi a demonstração de que os sons que ele tornava perceptíveis correlacionavam-se com achados anátomo-patológicos de maneira sistemática e replicável — a auscultação passou a ter poder preditivo demonstrável. A autoridade diagnóstica migrou para o instrumento porque o instrumento produzia resultados que outros médicos podiam verificar e que se conectavam com a fisiopatologia de maneira mais precisa do que a observação multimodal anterior. Isso não significa que a observação multimodal era inferior em todas as dimensões — mas que, no critério específico de poder preditivo verificável, o instrumento venceu.

O prontuário eletrônico percorreu uma trajetória estruturalmente semelhante, com uma diferença importante: suas transformações não antecipadas ainda estão em andamento, e parte delas ainda não foi reconhecida como problema. Quando foi promovido como reforma de segurança, o argumento era irrespondível: caligrafia ilegível causava mortes, erros de medicação eram rastreáveis e evitáveis, a continuidade do cuidado entre profissionais dependia de registros acessíveis. Esses benefícios se realizaram em alguma medida — estudos documentaram redução em determinados tipos de erro de medicação. Mas o instrumento fez ao encontro clínico algo que seus criadores não previam.

A primeira transformação não antecipada foi a reorganização do tempo e da atenção durante a consulta. O médico, que antes registrava o encontro ao final e durante ele mantinha o foco no paciente, passou a documentar em tempo real porque o sistema exige campos preenchidos em sequência, alertas de interação medicamentosa que requerem resposta imediata, ordens digitadas durante o atendimento. O resultado foi o surgimento do “médico de costas” — profissional que passa a consulta olhando para a tela enquanto o paciente fala. Não foi uma escolha deliberada: foi a consequência de uma interface que demanda atenção contínua durante o ato clínico. O encontro, que antes era estruturado pela agenda do paciente, passou a ser estruturado pela agenda do formulário.

A segunda transformação foi a substituição do julgamento clínico pela documentação do julgamento clínico. O que antes era um raciocínio que o médico registrava em texto livre, com nuances, incertezas e hipóteses alternativas, passou a ser um conjunto de cliques em campos estruturados que forçam a redução do raciocínio a categorias predefinidas. A “fadiga por cliques” não é apenas um fenômeno de ergonomia — é o colapso do espaço cognitivo necessário para o pensamento clínico genuíno sob o peso de uma interface que exige atenção fragmentada e respostas binárias.

Aqui reside a conexão com o conceito de Borgmann: o prontuário eletrônico é, no sentido pleno do termo, um “dispositivo” conforme descrito no material. Ele entrega um resultado — o registro clínico — sem que seu usuário precise se conscientizar de tudo que o instrumento está fazendo ao próprio ato de registrar. O médico usa o prontuário e vê o resultado: existe um registro. O que permanece oculto é o processo de seleção e de simplificação que ocorre entre o encontro real e o registro: o que é incluído e o que não pode ser registrado, o que a interface valoriza e o que ela descarta, quais aspectos do sofrimento do paciente encontram campos no formulário e quais simplesmente desaparecem do registro oficial do cuidado. O instrumento oculta sua operação e se apresenta apenas como resultado — e é exatamente isso que Borgmann chama de “dispositivo” em contraposição à “coisa”, que é o artefato cujo funcionamento permanece visível e envolve o usuário em uma prática que o enriquece.

A análise dos dois instrumentos se ilumina mutuamente porque revela que o problema não é específico de nenhuma tecnologia: é estrutural. Toda tecnologia médica que medeia o encontro clínico reorganiza o que conta como evidência, quem tem autoridade sobre o diagnóstico e quais dimensões do cuidado são tornadas visíveis ou invisíveis. O estetoscópio tornou invisível o contato direto; o prontuário eletrônico torna invisível o raciocínio em texto livre e a agenda do paciente. Em ambos os casos, as resistências iniciais tinham clareza sobre o que estava sendo perdido — e foram ignoradas porque o que era ganho era mais facilmente mensurável. A pergunta que o material nos convida a fazer é sempre: o que está sendo tornado invisível? E quem paga o custo dessa invisibilidade?

Dicas de resolução para o professor

O erro mais frequente nessa atividade é tratar as resistências ao estetoscópio como simples conservadorismo médico sem conteúdo intelectual. Os estudantes que cometem esse erro tipicamente escrevem algo como “os médicos mais velhos resistiam porque não queriam mudar” e passam adiante, sem perceber que a tarefa exige identificar o conteúdo epistemológico específico da resistência. O professor deve perguntar: “o médico que dizia que o estetoscópio interpunha uma barreira estava errado? Em que sentido estava certo? Em que sentido o instrumento realmente interpôs algo entre ele e o paciente?”

O segundo erro frequente é não conseguir distinguir Borgmann do senso comum sobre “tecnologia que muda comportamentos”. Muitos estudantes vão escrever que o prontuário eletrônico “mudou a dinâmica da consulta” sem chegar ao conceito de “dispositivo”, que é específico: a ideia de que a tecnologia oculta seu funcionamento e se apresenta apenas como resultado. O professor pode reforçar a distinção com uma pergunta: “quando você usa o prontuário e vê o registro, você enxerga o que o prontuário fez ao encontro — o que ele selecionou, o que ele descartou, como ele moldou o raciocínio? Ou você vê apenas o resultado?” Esse enquadramento tende a tornar o conceito concreto para os estudantes.

O terceiro ponto de dificuldade é a integração das duas análises. A atividade pede explicitamente que as análises se iluminem mutuamente, e respostas medianas simplesmente justapõem dois parágrafos sobre o estetoscópio e dois sobre o prontuário sem conexão explícita. Respostas excelentes identificam o padrão estrutural que atravessa os dois casos: a tendência da inovação tecnológica a tornar invisível o que transforma, e a tendência da crítica inicial a ser descartada como conservadorismo quando na verdade captura algo real. O professor pode estimular esse nível de integração perguntando: “que argumento você poderia fazer usando apenas esses dois exemplos sobre como as inovações médicas costumam ser avaliadas quando surgem?”

O que distingue uma resposta mediana de uma excelente nessa atividade é precisamente a capacidade de segurar a complexidade: reconhecer que o estetoscópio foi genuinamente um avanço E que as críticas ao que ele fazia ao encontro eram genuinamente pertinentes; reconhecer que o prontuário eletrônico reduziu erros E que gerou novos problemas que seus criadores não anteciparam. A tentação de simplificar — “foi bom” ou “foi ruim” — é o sinal de uma resposta de baixo desempenho.

Como explicar a resolução aos estudantes

Uma estratégia eficaz para abrir a discussão é perguntar à turma: “alguém aqui já ficou esperando o médico terminar de digitar para poder falar?” A maioria dos estudantes de medicina terá essa experiência como paciente ou como acompanhante, e isso ancora a discussão em algo vivido antes de torná-la abstrata. O professor pode então dizer: “o que acabou de acontecer ali — o médico de costas, a consulta estruturada pelo formulário — tem um nome no material. Alguém lembra qual é?”

Para o estetoscópio, uma boa estratégia é começar pela cena da invenção — Laennec enrolando papel para não colocar o ouvido diretamente no tórax de uma jovem — e perguntar: “esse foi um problema de pudor ou foi também uma questão sobre o que conta como evidência válida no exame clínico?” A pergunta incomoda porque parece excessiva — “foi só pudor” — mas leva o estudante a perceber que a solução de Laennec escolheu um tipo de evidência (o som interno) em detrimento de outros tipos (o contato, o calor, a observação direta) e que essa escolha não era tecnicamente neutra.

O professor pode então apresentar as resistências ao estetoscópio e perguntar: “esses médicos mais velhos estavam errados? O que eles estavam defendendo?” O objetivo é que os estudantes percebam que a resistência tinha fundamento — que algo real estava sendo perdido — mesmo que o que se ganhava fosse maior. Essa capacidade de reconhecer valor em resistências a inovações, sem por isso ser antimoderno, é um dos objetivos formativos centrais do módulo.

Para o prontuário eletrônico, o professor pode pedir que os estudantes descrevam uma consulta ideal — o que o médico deveria estar fazendo, para onde deveria estar olhando, como deveria estar se relacionando com o paciente. Depois, descreve a realidade do prontuário eletrônico contemporâneo. A dissonância entre as duas descrições é o problema. O professor pode então perguntar: “quem decidiu que a consulta deveria ser assim? O médico decidiu? O paciente decidiu? Ou o software decidiu?” A resposta — o software definiu a estrutura do encontro — é o momento de introduzir Borgmann.

O conceito de “dispositivo” de Borgmann é abstrato quando apresentado diretamente, mas concreto quando apresentado por contraste. Uma boa analogia é o cozinhar: quando alguém cozinha, vê o fogo, sente o calor, cheira o alimento, ajusta o tempero pelo paladar — a prática é visível em todas as suas dimensões. Quando aquece comida pronta no micro-ondas, vê apenas o resultado. Borgmann chamaria o micro-ondas de “dispositivo”: entrega “refeição quente” sem envolver a pessoa na prática culinária. O professor pode então perguntar: “em que sentido o prontuário eletrônico faz com o registro clínico o que o micro-ondas faz com a culinária?”

Por fim, o professor deve garantir que os estudantes compreendam o que a atividade pediu de integração: as duas análises devem iluminar uma à outra. A síntese que se espera é que ambos os instrumentos tornaram invisível o que transformaram, e que as resistências que geraram tinham conteúdo legítimo que foi descartado antes de ser compreendido. Esse padrão estrutural é o que o material quer que o estudante desenvolva capacidade de identificar — não apenas para esses dois casos, mas para qualquer inovação médica que encontrar ao longo da carreira.

Atividade 2 — Resolução

Resolução modelo

O caso do teste genômico de predisposição ao câncer por variantes nos genes BRCA1 e BRCA2 constitui um exemplo de especial riqueza para a análise crítica de tecnologias médicas porque evidencia algo que as narrativas de progresso tecnológico tendem a esconder: uma tecnologia pode ampliar desigualdade precisamente enquanto promete democratizar acesso. Aplicar as perguntas do framework ao caso do BRCA não é um exercício retórico — é um procedimento analítico que revela camadas de exclusão que não se tornam visíveis quando se olha apenas para o preço do teste.

A segunda pergunta do framework — para quem a tecnologia resolve o problema? — exige que se vá além da pergunta mais simples de quem pode pagar. Quando se descreve o perfil atual das pessoas que realizam testes BRCA no Brasil — majoritariamente mulheres brancas, de alta renda, com ensino superior completo, residentes em capitais do Sul e Sudeste — está-se descrevendo a barreira financeira em ação. Um teste que custa entre R$ 1.800 e R$ 3.500 está automaticamente fora do alcance de famílias de baixa renda, e isso por si só já configura uma forma de exclusão que o framework deve capturar. Mas a pesquisadora de saúde pública cujo argumento é apresentado no caso aponta para uma segunda barreira, de natureza completamente diferente, que opera mesmo quando a financeira é removida.

Essa segunda barreira é técnico-científica, e sua lógica é a seguinte: os painéis comerciais disponíveis para teste BRCA foram desenvolvidos e validados predominantemente em coortes de origem europeia. Isso significa que as variantes identificadas com precisão pelos painéis são aquelas com maior prevalência em populações europeias. Populações de origem africana no Brasil têm um espectro diferente de variantes nos genes BRCA1 e BRCA2 — e quando o painel não encontra variantes que reconhece como patogênicas ou benignas, o resultado é classificado como “variante de significado incerto” (VUS). Uma VUS não é um diagnóstico — é uma incerteza. O paciente que recebe uma VUS não sabe se tem risco aumentado ou risco normal. O médico que recebe o resultado de VUS não tem base para recomendar mastectomia profilática, mas também não tem base para afirmar que a paciente está segura.

Isso significa que, mesmo que o custo do teste fosse integralmente subsidiado pelo SUS e disponibilizado gratuitamente a toda mulher com indicação clínica no Brasil, o teste seria menos útil — ou até clinicamente prejudicial, na forma de ansiedade e decisões clínicas sem fundamento — para mulheres de origem africana do que para mulheres de origem europeia. A desigualdade aqui não é de acesso ao produto: é de substrato científico. O conhecimento que sustenta o teste foi produzido em uma população e transferido para outra sem a validação necessária.

A terceira pergunta do framework — a que custo? — deve ser aplicada com escopo mais amplo do que o custo financeiro direto. O primeiro custo adicional que o caso evidencia é o custo de equidade. O teste BRCA, como está hoje, amplifica desigualdades de mortalidade por câncer que já existem no sistema de saúde. Mulheres negras no Brasil já têm menor acesso a rastreamento de câncer de mama e diagnóstico em estágios mais avançados. A introdução de um teste de alto custo que funciona melhor para mulheres brancas — seja por razões financeiras ou científicas — adiciona uma nova camada de desvantagem sobre desigualdades preexistentes. O teste não cria a desigualdade, mas a aprofunda.

O segundo custo adicional é o custo epistêmico. A situação clínica de uma paciente que recebe um resultado de VUS é potencialmente pior do que a situação de uma paciente que nunca realizou o teste. Ela sabe que há algo incerto em seu DNA, mas não sabe o que isso significa. Essa incerteza pode motivar novas consultas com geneticistas, solicitação de exames adicionais, ansiedade contínua, e em alguns casos decisões cirúrgicas baseadas em precaução que a evidência científica não sustenta para aquela variante. O custo epistêmico é o custo de ter mais informação sem ter mais conhecimento — e de ter que tomar decisões clínicas em um espaço de incerteza que o teste criou.

O terceiro custo é o de oportunidade para o sistema. Cada real alocado a testes BRCA de alto custo para um número pequeno de pacientes com acesso privado é um real que não está sendo alocado a intervenções de maior impacto populacional para as populações de maior risco. O rastreamento familiar estruturado por anamnese — identificar famílias de alto risco de câncer hereditário por história familiar detalhada — é uma intervenção de baixíssimo custo e alta efetividade que, se aplicada sistematicamente na atenção primária, poderia identificar uma parcela significativa das famílias que se beneficiariam do teste genômico. O custo de oportunidade do modelo atual é invisível porque o modelo atual não foi escolhido deliberadamente: emergiu da lógica de mercado. Mas ele é real.

Para comparar a situação atual com a trajetória disruptiva do ultrassom portátil, é preciso primeiro compreender o que fez o ultrassom se tornar disruptivo. O ultrassom portátil não nasceu como um produto melhor do que o ultrassom hospitalar convencional nos critérios que os radiologistas tradicionais valorizavam — qualidade de imagem, resolução, profundidade de campo. Ele nasceu como um produto suficientemente bom para contextos onde antes não havia nenhum ultrassom: a ambulância, o consultório de medicina de família, a clínica rural, o país de baixa renda. A disrupção ocorreu porque a barreira de acesso — o custo e a complexidade do equipamento — foi radicalmente reduzida, alcançando contextos onde a necessidade existia mas o recurso não chegava.

Para que o rastreamento genômico seguisse uma trajetória similar, seriam necessárias transformações em pelo menos quatro dimensões. A primeira é a redução radical de custo, que o sequenciamento de nova geração está aproximando mas ainda não realizou no ponto de democratização real. A segunda — e aqui está a distinção mais importante em relação ao ultrassom — é o desenvolvimento de painéis genômicos validados em populações brasileiras diversas, incluindo populações de origem africana com suas variantes BRCA específicas. Isso exige pesquisa genômica de diversidade que está apenas começando a ser realizada no Brasil por instituições como FIOCRUZ e grupos de genômica das universidades federais. Sem essa base científica, um teste barato para populações negras ainda seria um teste impreciso para populações negras.

A terceira transformação necessária seria o desenvolvimento de modelos de triagem simplificada que identificassem as variantes mais prevalentes nas populações específicas a serem alcançadas — não simplesmente transplantar os painéis europeus para um contexto diferente, mas reengenheirar o produto para o contexto. A quarta transformação seria a integração com a atenção primária: usar a anamnese familiar estruturada como primeiro filtro para identificar famílias de alto risco, e reservar o teste genômico — mesmo que barato — para quem tem indicação clara. O modelo disruptivo do ultrassom portátil foi possível porque o produto chegou ao ponto de cuidado. O rastreamento genômico disruptivo exigiria não apenas que o produto chegasse ao ponto de cuidado, mas que o produto fosse apropriado para as populações que esse ponto de cuidado atende.

Dicas de resolução para o professor

O erro mais frequente nessa atividade é a redução de toda a análise à barreira financeira. Estudantes que não leram o caso com atenção suficiente escrevem que o problema é que o teste é caro e que a solução é subsidiá-lo pelo SUS. Essa resposta não está errada — mas está incompleta de maneira significativa. O professor deve perguntar diretamente: “se o governo federal decidisse amanhã cobrir o teste BRCA para todas as mulheres com indicação no SUS, o problema estaria resolvido? Por quê não?” A resposta a essa pergunta é o coração da atividade.

O segundo ponto de dificuldade é a distinção entre custo de equidade, custo epistêmico e custo de oportunidade. Estudantes tendem a colapsá-los em um único argumento sobre desigualdade social. O professor deve insistir que os três são mecanismos distintos: o custo de equidade é sobre quem tem acesso ao benefício; o custo epistêmico é sobre o que acontece ao paciente que recebe um resultado incerto; e o custo de oportunidade é sobre o que deixa de ser feito com os mesmos recursos. São três formas diferentes de dano, operando em três dimensões diferentes.

O terceiro ponto de atenção é a comparação com o ultrassom portátil. Respostas medianas identificam que o ultrassom ficou mais barato e portátil e afirmam que o BRCA precisaria ficar mais barato e portátil também. Respostas excelentes identificam o que é diferente: que o ultrassom portátil era um produto tecnicamente inferior ao convencional mas funcionava para o contexto onde chegava, enquanto um teste BRCA barato mas validado apenas em populações europeias seria tecnicamente inapropriado para as populações que mais precisam. A trajetória disruptiva no rastreamento genômico exige não apenas redução de custo, mas reengenharia da base científica para os contextos de chegada.

Como explicar a resolução aos estudantes

Uma boa abertura é a seguinte pergunta: “se eu lhes dissesse que existe uma tecnologia que poderia evitar 1.800 mortes por câncer por ano no Brasil, mas que 90% dessas mortes são de mulheres que não têm acesso à tecnologia, vocês diriam que a tecnologia resolve o problema?” A maioria dos estudantes vai hesitar, e essa hesitação é o ponto de entrada. O professor pode então desenvolver: “e se eu lhes dissesse que, mesmo para as mulheres que têm acesso, a tecnologia funciona melhor para algumas e pior para outras, dependendo de onde seus ancestrais nasceram?”

Para explicar a barreira técnico-científica — a questão das variantes de significado incerto — o professor pode usar a seguinte analogia: “imaginem que vocês receberam um manual de instruções para montar um equipamento, mas o manual foi escrito para um modelo diferente do que vocês têm. Algumas instruções se aplicam, outras não, e vocês não sabem quais são quais. Isso é mais útil ou mais perigoso do que não ter manual nenhum?” Esse enquadramento torna intuitivo o problema da VUS.

Para a parte sobre trajetória disruptiva, o professor pode projetar o gráfico do hype cycle e perguntar onde os estudantes posicionariam o rastreamento genômico hoje — e o que precisaria acontecer para que ele chegasse ao platô de produtividade de maneira equitativa. Isso conecta a atividade ao conceito central do módulo sobre disrupção e facilita a identificação das quatro dimensões de transformação necessárias.

Por fim, o professor deve garantir que os estudantes compreendam o argumento da pesquisadora de saúde pública como um argumento técnico, não apenas político. A pesquisadora não está dizendo que o teste é ruim. Está dizendo que o teste, como está, amplifica desigualdades porque foi desenvolvido para algumas populações e não para outras — e que isso é um problema de ciência antes de ser um problema de política. Essa distinção é importante para que os estudantes aprendam a reconhecer quando um argumento sobre equidade é também um argumento sobre qualidade da evidência.

Atividade 3 — Resolução

Resolução modelo

Voto técnico ao Comitê de Inovação — Plataforma MindGate

Dimensão I — Classificação e posicionamento no hype cycle

O MindGate apresenta as características definidoras de uma inovação disruptiva conforme o conceito desenvolvido por Christensen e discutido no material desta disciplina. Para compreender por que, é preciso identificar quem são os não-consumidores que a tecnologia alcança. A atenção primária à saúde no Brasil atende uma população que, em sua maioria, nunca foi sistematicamente rastreada para transtornos mentais: não porque os profissionais de saúde da família não queiram rastrear, mas porque o tempo de consulta é insuficiente, o treinamento em saúde mental é limitado na maior parte dos cursos de medicina de família, e os instrumentos de rastreamento disponíveis — como o PHQ-9 na versão aplicada pelo clínico — consomem minutos que a consulta de atenção primária frequentemente não tem. O dado apresentado pela empresa — de que mais de 70% dos casos de depressão moderada a grave na atenção primária não são detectados — é epidemiologicamente plausível e reflete exatamente essa lacuna de cobertura.

A tecnologia não é melhor do que um psiquiatra em consultório para fazer diagnóstico diferencial de transtornos de humor. Se o critério de avaliação for a precisão diagnóstica em um ambiente controlado com tempo ilimitado, o MindGate perde para o especialista. Mas o MindGate não está competindo com o psiquiatra — está operando em um contexto onde o psiquiatra simplesmente não existe como recurso acessível. A estrutura da disrupção é clássica: produto que seria inferior nos critérios do mercado estabelecido, mas suficientemente bom para um contexto de não-consumo onde a alternativa é a ausência de serviço.

No entanto, o posicionamento no hype cycle de Gartner é de cautela necessária. As características do MindGate neste momento sugerem que a tecnologia está próxima ao pico de expectativas inflacionadas, ou talvez já o tenha atingido. Os sinais são os seguintes: dados de validação de contexto único e homogêneo sendo apresentados como se validassem a tecnologia para uso ampliado; ausência de dados sobre o que acontece após a triagem (quem efetivamente acessa atendimento, o que muda nos desfechos clínicos); e promessas de escalabilidade — “aumentar em três vezes a detecção sem aumentar o tempo de consulta” — que descrevem o desempenho em condições ideais sem evidência de que esse desempenho se manterá em populações diferentes, com profissionais diferentes e em contextos organizacionais diferentes.

O risco característico da fase de pico de expectativas em contexto clínico não é que a tecnologia seja ruim — é que ela seja adotada em escala antes de haver evidências suficientes para calibrar seu uso adequado, seus limites e suas condições de segurança. Quando as limitações aparecem — e com inovações em saúde sempre aparecem — a reação é frequentemente de rejeição excessiva, que é o vale de desilusão. O comitê que adota o MindGate hoje sem as salvaguardas adequadas está correndo o risco de ter que abandoná-lo em dois anos sob pressão de um incidente de falso positivo com consequências graves, em vez de aprender gradualmente como usar o instrumento com eficácia.

Dimensão II — Análise da evidência

O estudo de validação apresentado pela empresa tem qualidades metodológicas reais e limitações que o comitê deve avaliar com precisão. Do lado das qualidades: a amostra de 1.240 pacientes é razoável para um estudo de validação de instrumento de triagem; os índices de sensibilidade (91%) e especificidade (87%) são clinicamente relevantes, especialmente a sensibilidade elevada, que é a propriedade mais valorizada em instrumentos de rastreamento; a publicação em periódico de medicina de família, embora nacional, indica revisão por pares. Do lado das limitações, há três questões específicas que o comitê deve considerar.

A primeira é a validade externa do estudo. Toda a amostra de validação foi coletada em duas UBS de um único bairro de São Paulo. Isso significa que o instrumento foi validado em uma população com determinadas características socioeconômicas, culturais, de escolaridade e de expressão linguística do sofrimento. A população atendida pela rede universitária onde o MindGate está sendo proposto pode diferir substancialmente nessas dimensões. A distinção entre eficácia e efetividade é aqui essencial: eficácia é o desempenho de uma intervenção em condições controladas, na população estudada; efetividade é o desempenho em condições reais de uso, na população que será atendida. O estudo demonstrou eficácia em condições específicas. Efetividade para a rede universitária é completamente desconhecida.

A segunda limitação é a ausência de dados sobre o que acontece após a triagem. O estudo mede sensibilidade e especificidade — o quanto o MindGate detecta corretamente casos e não-casos. Mas não mede o que é relevante para a decisão do comitê: o que acontece com os pacientes classificados como de alto risco que acessam a fila de saúde mental? Quantos confirmam diagnóstico? Quantos são falsos positivos que consomem recursos da fila sobrecarregada? Qual é a latência entre a triagem e o primeiro atendimento especializado? Nenhuma dessas perguntas — que são sobre efetividade no sentido pleno — é respondida pelo estudo apresentado.

A terceira limitação é estrutural: o estudo foi realizado pela empresa ou com financiamento da empresa, o que cria conflito de interesse que deve estar declarado e avaliado. Estudos financiados pelo fabricante sistematicamente tendem a superestimar o desempenho de produtos. Para demonstrar efetividade para a rede universitária, o mínimo necessário seria: validação realizada na própria rede, com amostra representativa de sua população; coleta de dados sobre desfechos além da triagem (quem acessa atendimento, qual diagnóstico confirmado, o que muda no curso do tratamento); e monitoramento independente da taxa de falsos positivos e de seu impacto sobre a fila de saúde mental.

Dimensão III — Quem ganha e quem perde

A análise da quinta pergunta do framework exige que o comitê mapeie todos os atores relevantes, incluindo os que não têm representação direta na reunião de apresentação.

Os pacientes que seriam triados e identificados corretamente como tendo transtorno mental moderado a grave — os verdadeiros positivos — são os ganhadores mais evidentes, e são numericamente o argumento mais forte em favor da tecnologia. Se o dado de que 70% dos casos não são detectados é correto, há uma população real que atualmente chega à UBS com sofrimento psíquico significativo e vai embora sem diagnóstico ou encaminhamento. Para essa população, o MindGate representa a diferença entre ter e não ter uma porta de entrada para o cuidado.

Os médicos de família e enfermeiros da atenção primária ganham um apoio diagnóstico em uma área em que frequentemente se sentem mal preparados. A geração automática de um relatório de risco antes da consulta pode estruturar a abordagem de saúde mental e reduzir a carga cognitiva de uma consulta que já é sobrecarregada.

A startup e seus investidores ganham com a adoção por uma rede universitária, que confere credibilidade institucional ao produto e pode abrir portas para outros contratos públicos.

Os perdedores são mais difusos, mas potencialmente mais vulneráveis. Os falsos positivos — pacientes que o sistema classifica como de alto risco sem que tenham transtorno mental significativo — entram em uma fila de saúde mental que os psiquiatras já descrevem como sobrecarregada. O dano tem duas dimensões: para o paciente, a ansiedade de ter sido classificado como portador de risco de suicídio ou depressão grave quando não tem essa condição, além do tempo e deslocamento consumidos em consultas desnecessárias; para o sistema, a ocupação de vagas escassas por pacientes sem necessidade, que retarda o acesso dos verdadeiros positivos. Em uma rede com capacidade de saúde mental limitada, uma triagem de alta sensibilidade produzindo 13% de falsos positivos pode saturar rapidamente a fila.

Os pacientes que forneceram dados sem consentimento explícito para uso de inteligência artificial têm sua privacidade comprometida. A triagem ocorre antes da consulta, em um momento em que a relação terapêutica ainda não foi estabelecida e em que a pergunta sobre consentimento não foi feita. Os dados ficam armazenados em servidores da empresa, criando obrigações de proteção de dados que precisam ser reguladas por contrato específico com garantias compatíveis com a Lei Geral de Proteção de Dados.

Os psiquiatras têm uma posição ambígua. Por um lado, mais encaminhamentos significam mais demanda para um serviço especializado — o que pode ser interpretado como ganhadores. Por outro lado, os psiquiatras perdem controle sobre o portal de entrada do diagnóstico psiquiátrico: uma triagem automatizada passa a determinar quem chega até eles, com qual classificação prévia e com qual expectativa terapêutica formada pela interface do chatbot. Isso representa uma reorganização da autoridade diagnóstica — precisamente o tipo de deslocamento que o material deste módulo identifica como estrutural na história das inovações tecnológicas em medicina.

Dimensão IV — Recomendação fundamentada

Com base nas três dimensões anteriores, a recomendação ao comitê é de adoção condicionada a piloto controlado com avaliação prospectiva, sujeito às seguintes condições específicas que devem ser verificadas antes da expansão.

A primeira condição é a implementação de consentimento informado explícito antes de qualquer interação com o MindGate. O paciente que aguarda atendimento na sala de espera deve receber uma explicação — em linguagem acessível, respeitada a diversidade de escolaridade da população atendida — de que existe um instrumento de triagem de saúde mental baseado em inteligência artificial disponível, do que o sistema faz com as respostas, de quem terá acesso ao relatório e de que a não participação não afeta seu atendimento. A triagem sem consentimento não é apenas uma questão ética: é uma questão de validade dos dados. Pacientes que sabem que estão sendo triados respondem de maneira diferente de pacientes que não sabem.

A segunda condição é a auditoria de adequação à LGPD e a formalização de contrato de processamento de dados com cláusulas específicas sobre armazenamento, acesso, compartilhamento com terceiros, prazo de retenção e resposta a incidentes de segurança. A empresa não pode guardar dados de saúde mental de pacientes do SUS em servidores privados sem garantias contratuais específicas e sem submissão ao arcabouço regulatório do sistema de saúde.

A terceira condição é a coleta prospectiva de dados sobre a composição da população triada — renda, escolaridade, raça, origem — para comparação com a amostra de validação original. Se a população atendida pela rede universitária diferir significativamente em variáveis relevantes, os índices de sensibilidade e especificidade declarados pela empresa não são transferíveis sem novo estudo de validação.

A quarta condição é o monitoramento rigoroso da taxa de falsos positivos e de seu impacto na fila de saúde mental, com relatórios mensais para o comitê durante o período de piloto. Se a taxa de encaminhamentos aumentar sem aumento proporcional de diagnósticos confirmados, o piloto deve ser suspenso para revisão do protocolo de triagem ou do limiar de classificação de risco.

O período de piloto controlado deve ter duração mínima de doze meses, com avaliação formal ao final que determine se a expansão é tecnicamente recomendável. A recomendação de piloto controlado — em oposição à não adoção — fundamenta-se no reconhecimento de que a lacuna de detecção de transtornos mentais na atenção primária é real e grave, e que recusar tecnologias que poderiam endereçá-la sem dados suficientes seria, em si, uma forma de dano ao paciente. A incerteza da evidência não justifica a inação; justifica a prudência na expansão.

Dicas de resolução para o professor

Essa atividade é a mais complexa do módulo e também a mais reveladora das diferenças de desempenho entre os estudantes. Os erros mais frequentes ocorrem em três pontos específicos.

O primeiro erro é a confusão entre disruptivo e inovador. Muitos estudantes classificam o MindGate como inovação disruptiva apenas porque usa inteligência artificial — como se a sofisticação tecnológica equivalesse à disrupção no sentido de Christensen. O professor deve reforçar que disruptivo tem um significado técnico preciso no framework: começa em não-consumidores ou no mercado inferior, com produto que é pior nos critérios tradicionais mas mais acessível. A pergunta operacional é: “quem o MindGate alcança que antes não tinha acesso a nenhuma triagem de saúde mental?” Se o estudante consegue responder a essa pergunta com precisão — os 70% de casos não detectados na atenção primária — a classificação correta se torna óbvia.

O segundo erro está na análise de evidências: estudantes tendem a aceitar ou rejeitar os dados de validação em bloco, sem desconstruí-los metodologicamente. Uma resposta mediana diz “o estudo tem uma amostra pequena e é de um único bairro, portanto não é confiável”. Uma resposta excelente distingue o que o estudo demonstra validamente — o instrumento tem desempenho adequado em condições específicas — do que ele não demonstra: efetividade na população da rede universitária. O professor deve insistir: “o estudo é ruim ou é limitado? Qual é a diferença?” Ruim significa que os dados são inválidos; limitado significa que são válidos mas com escopo restrito. A distinção importa porque determina que ação é necessária: jogar fora o instrumento ou conduzir novos estudos na população de destino.

O terceiro erro — e o mais grave — é a tendência de respostas de alto desempenho aparente que fazem uma análise sofisticada das três primeiras dimensões e depois colapsam em uma recomendação vaga. “Recomendo adoção com cautela” sem especificar as condições é uma recomendação inútil para um comitê real. O professor deve exigir condições específicas, verificáveis e operacionalizáveis. “Consentimento informado” sem especificar o que o consentimento deve conter não é uma condição — é uma intenção. “Auditoria de LGPD” sem especificar quem audita e o que é verificado não é uma condição — é uma frase.

O que distingue uma resposta excelente nessa atividade é a integração das quatro dimensões em um argumento coerente. A classificação como disruptiva deve fundamentar a análise de ganhadores e perdedores (quem são os não-consumidores que seriam alcançados). O posicionamento no hype cycle deve fundamentar a recomendação (por que um piloto controlado e não adoção imediata). A análise de evidências deve fundamentar as condições do piloto (o que precisa ser monitorado porque o estudo não mediu). Respostas que tratam as quatro dimensões como seções independentes não são excelentes — são longas.

Como explicar a resolução aos estudantes

O professor pode abrir a discussão com uma pergunta que simule a decisão real do comitê: “vocês votariam a favor ou contra a adoção do MindGate? Mostrem as mãos.” Isso cria uma divisão visível na turma que o professor pode explorar: chamar um estudante que votou a favor e um que votou contra para explicar seu raciocínio. A divergência entre as duas posições, quando explicitada, cobre a maioria dos pontos que a atividade pede.

Para a classificação disruptiva, o professor pode perguntar: “se vocês fossem um psiquiatra estabelecido num consultório privado, vocês comprariam o MindGate para usar com seus pacientes?” A resposta provável é não — porque os pacientes de consultório privado já chegam com algum nível de triagem, com histórico familiar conhecido, e com tempo de consulta adequado para avaliação clínica. O MindGate é ruim para quem já tem o que ele substitui; é útil para quem não tem nada. Isso é a essência da disrupção.

Para o hype cycle, o professor pode pedir que os estudantes leiam em voz alta o argumento da empresa — “aumentar em três vezes a capacidade de detecção sem aumentar o tempo de consulta” — e perguntar: “que tipo de linguagem é essa? É linguagem de quem está no platô de produtividade com dados robustos, ou é linguagem de quem está no pico de expectativas?” Os estudantes costumam reconhecer imediatamente o tom de marketing exaltado, e isso os ajuda a identificar o posicionamento no hype cycle com fundamento.

Para a análise de evidências, o professor pode usar o seguinte enquadramento: “imaginem que vocês são pesquisadores e querem saber se o MindGate funciona para a população desta rede universitária. Que perguntas vocês fariam? Que dados vocês coletariam?” Essa inversão — de avaliadores passivos para pesquisadores ativos — tende a mobilizar o pensamento metodológico dos estudantes de maneira mais eficaz do que pedir que avaliem o estudo já existente.

Para a análise de ganhadores e perdedores, o professor deve garantir que os falsos positivos sejam tratados com a seriedade que a carta dos psiquiatras indica. Uma estratégia eficaz é perguntar: “quem é o paciente falso positivo? Ele existe de verdade? O que acontece com ele depois que o relatório MindGate o classifica como de alto risco para suicídio?” Tornar o paciente falso positivo concreto — um homem de 55 anos com ansiedade situacional relacionada ao desemprego, classificado como alto risco, que passa três meses na fila de psiquiatria antes de ser avaliado e liberado sem diagnóstico psiquiátrico — muda a percepção do estudante sobre o custo do falso positivo de maneira que os dados estatísticos não conseguem.

Por fim, o professor deve usar a recomendação como um exercício de especificidade. Após a discussão, pedir que cada estudante escreva uma condição específica para o piloto controlado — não “garantir a privacidade dos dados” mas “exigir que o contrato com a empresa proíba o uso dos dados para qualquer finalidade além da triagem clínica e especifique o prazo máximo de retenção em 24 meses” — é uma forma de tornar o exercício de recomendação técnica algo que os estudantes levarão para sua prática profissional como médicos, gestores de saúde ou pesquisadores.