podcast:episodios:56
Diferencias
Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| podcast:episodios:56 [2023/03/29 18:13] – [[G] Generative] Joaquín Herrero Pintado | podcast:episodios:56 [2023/03/30 17:43] (actual) – [El "alignment Problem"] Joaquín Herrero Pintado | ||
|---|---|---|---|
| Línea 135: | Línea 135: | ||
| ### GPT-4 | ### GPT-4 | ||
| - | [GPT-4](https:// | + | [GPT-4 |
| - | [GPT-4 Tecnical Report](https:// | + | [GPT-4 Tecnical Report](https:// |
| + | [GPT-4 System Card](https:// | ||
| + | |||
| + | Este es el video en el que se transmitió en directo la primera demo de GPT-4. | ||
| < | < | ||
| Línea 188: | Línea 191: | ||
| (Redactado por GPT-3.5) | (Redactado por GPT-3.5) | ||
| + | |||
| + | ### Pendiente de resolver: el " | ||
| + | |||
| + | El " | ||
| + | |||
| + | Los modelos de lenguaje como ChatGPT son el resultado del entrenamiento en grandes conjuntos de datos de texto que contienen información de diversas fuentes y perspectivas. Como resultado, pueden adoptar sesgos, creencias erróneas y comportamientos no deseados que no siempre están en consonancia con las intenciones del usuario o el bienestar general. | ||
| + | |||
| + | El problema de alineación en IA plantea varios desafíos: | ||
| + | |||
| + | - Sesgo y justicia: Asegurar que el modelo no tenga sesgos sistemáticos o discriminación en sus respuestas. | ||
| + | - Seguridad: Prevenir que el modelo proporcione respuestas dañinas, ofensivas o inapropiadas. | ||
| + | - Privacidad: Evitar que el modelo divulgue información confidencial o sensible. | ||
| + | - Robustez y fiabilidad: Garantizar que el modelo responda de manera consistente y confiable a las entradas del usuario, incluso en casos de entradas ambiguas o maliciosas. | ||
| + | - Control de contenido y políticas: Establecer pautas claras y efectivas para el comportamiento del modelo y garantizar que se adhiera a ellas. | ||
| + | |||
| + | Resolver el problema de alineación es crucial para el desarrollo y adopción segura y ética de sistemas de inteligencia artificial como ChatGPT en diferentes aplicaciones y contextos. | ||
| + | |||
| + | (Redactado por GPT-4) | ||
| # Políticas empresariales y de producto | # Políticas empresariales y de producto | ||
| Línea 214: | Línea 235: | ||
| ## Características de los modelos de lenguaje de OpenAI | ## Características de los modelos de lenguaje de OpenAI | ||
| - | ### 1. RLHF - Reinforcement Learning with Human Feedback | + | ### 1. RLHF - Reinforcement Learning with Human Feedback |
| Línea 392: | Línea 413: | ||
| En [[https:// | En [[https:// | ||
| - | Traducción automática del hilo, revisada: | + | (Traducción automática del hilo, revisada) |
| La discusión ofrece una perspectiva útil y equilibrada. Preguntas/ | La discusión ofrece una perspectiva útil y equilibrada. Preguntas/ | ||
| Línea 411: | Línea 432: | ||
| 8. A pesar de todo parece probable que los humanos que usan LLM cambien drásticamente la organización económica y la naturaleza del trabajo. | 8. A pesar de todo parece probable que los humanos que usan LLM cambien drásticamente la organización económica y la naturaleza del trabajo. | ||
| + | |||
| + | |||
| + | ====== ¿Los modelos de lenguaje comprenden realmente lo que les preguntamos? | ||
| + | |||
| + | Preguntamos a GPT-4: | ||
| + | |||
| + | ¿Tú comprendes las cosas que te pregunto? | ||
| + | |||
| + | > Sí, como inteligencia artificial, mi función principal es comprender y procesar preguntas para proporcionar respuestas y asistencia en una amplia variedad de temas. Si tienes alguna duda o inquietud, no dudes en preguntarme y estaré encantado de ayudarte. | ||
| + | |||
| + | ¿Pero entiendes de la misma forma que los humanos? | ||
| + | |||
| + | > Aunque puedo procesar y comprender el lenguaje humano de manera efectiva, mi comprensión es diferente a la de un ser humano. Como inteligencia artificial, no experimento emociones, pensamientos subjetivos ni consciencia de la misma manera que las personas. Mi capacidad para comprender se basa en el análisis de patrones y la correlación de datos en lugar de la experiencia humana vivida. Esto significa que, aunque puedo proporcionar información útil y relevante en respuesta a tus preguntas, no experimento el proceso de comprensión de la misma manera que un ser humano lo haría. | ||
| + | |||
| + | |||
| + | Sobre este asunto es muy interesante el artículo " | ||
| + | |||
| + | También es muy relevante el artículo " | ||
podcast/episodios/56.1680113589.txt.gz · Última modificación: por Joaquín Herrero Pintado
