La última versión de ChatGPT, el chatbot de IA desarrollado por OpenAI, acaba de pasar a la historia como el primer modelo de IA en superar con éxito el examen de medicina de EEUU
Además, por si este hecho no fuera suficiente, también ha mostrado un desempeño sorprendentemente idóneo a la hora de realizar labores relacionadas con la profesión, logrando diagnosticar pacientes al mismo nivel que lo haría un profesional.
Isaac Kohane, junto al resto de su equipo de la Universidad de Harvard, realizaron una serie de experimentos encaminados a determinar si GPT-4 podría funcionar de forma apropiada en entornos relacionadas con la medicina.
En su libro recientemente publicado “La revolución de la IA en la medicina“, Kohane hace referencia a fascinantes descubrimientos sobre sus experimentos.
Su primera edición fue coescrita junto con el periodista independiente Carey Goldberg, y el vicepresidente de investigación de Microsoft, Peter Lee.
GPT-4 es la última versión de ChatGPT, lanzada en marzo de 2023. Este modelo de IA de procesamiento de lenguaje de última generación es capaz de generar texto de forma similar a como lo haría un ser humano.
ChatGPT: IA al mismo nivel de medicina que muchos humanos
Los investigadores se llevaron una sorpresa cuando este modelo de IA resultó superar en muchos casos los resultados obtenidos por algunos médicos con licencia. De acuerdo con los resultados publicados, GPT-4 logró responder correctamente a las preguntas de licencia de examen médico de EEUU más del 90% de las veces.
Este logro, supera a los obtenidos por versiones anteriores de ChatGPT, que según experimentos previos, habían logrado superar a duras penas el examen de medicina de Estados Unidos.
La prueba es famosa por su dificultad y cubre conceptos básicos muy diversos, abarcando desde ciencias hasta bioética. Una persona promedio suele tardar en torno a 300 horas de preparación para completarlo.
GPT-4, por el contrario, fue capaz de aprobar este examen sin necesidad de realizar un estudio previo. Aunque es necesario destacar que este tipo de IA utiliza un lenguaje grande (o LLM), orientado a dar respuestas predictivas de texto.
La IA, toda una sorpresa
En otras palabras: el sistema no “sabe”, pero puede construir oraciones plausibles mediante el análisis de una gran cantidad de material en línea.
Al ser consultada sobre la posibilidad de realizar este examen, el ordenador le dijo a Kohane que está “limitada a patrones en los datos y no implica una verdadera compresnión o intencionalidad”. En cualquier caso, a pesar de la existencia de limitaciones, la máquina pudo imitar algunas de las labores que desarrollaría un médico.
Según los hallazgos de Kohane, GPT- 4 logró demostrar ser un gran examinador con un éxito impactante. En su libro, detalla como la máquina fue capaz de diagnosticar correctamente una condición de 1 en 100.000 llamada hiperplasia suprarrenal congénita.
“Lo hizo tal y como lo haría yo con todos mis años de estudio y experiencia”
Adicionalmente, los autores también señalaros otras labores en las que el sistema de IA destacó de forma exitosa, tales como realizar sugerencias a los médicos relacionadas con el trato al paciente y analizar informes o estudios extensos de forma expedita.
La IA lejos de ser perfecta aunque pase examen médico de EEUU
A pesar de las asombrosas capacidades demostradas, GPT-4 está lejos de ser perfecto, en base a los errores e imperfecciones mostradas en los experimentos.
Estos pueden ir desde simples errores administrativos (como tergiversar un índice de masa corporal) hasta errores matemáticos u olvidarse de cuadrar un término en una ecuación.
Kohane y su equipo concluyeron que el modelo más reciente de ChatGPT es capaz de inventar respuestas o desobedecer a las solicitudes, algo que ya ocurría en versiones anteriores del software. La IA también parece reticente a admitir sus errores e incluso admite no tener una ética definida, lo cual puede suponer un gran impedimento dentro del ámbito de la medicina.
El investigador dijo encontrar “alucinante” que muy pronto “millones de familias” tendrán acceso a esta “experiencia médica” virtual desde la comodidad de sus casas.
Igualmente, manifestó preocupaciones sobre la capacidad de que los científicos puedan garantizar que el consejo de GPT-4 sea seguro y efectivo.
Según las conclusiones del estudio, el sistema de IA todavía no estaría completamente preparado para reemplazar a un médico, a pesar de haber aprobado el examen de EEUU; pero, sin duda, se trata de una herramienta útil para los expertos de esta materia, especialmente si se utiliza en forma de asistente, con la posterior verificación de un profesional.
Mientras tanto, los científicos consideran que ya es hora de comenzar a plantearnos un futuro muy diferente para la medicina.