Words.cat | Ve vídeos de YouTube y aprende idiomas

En el siguiente artículo voy a escribir sobre el proceso de creación de una nueva aplicación que tengo en mente. Relacionada con el aprendizaje de idiomas, su finalidad es la de aprender nuevas palabras en un idioma dado consumiendo contenidos reales, haciendo uso de:

  • Vídeos de YouTube
  • Noticias y posts en blogs
Este proyecto es la continuación de un proyecto anterior que dejé a medio terminar, Des Mots (palabras, en francés). En aquel proyecto quise crear un diccionario con funcionalidades adicionales como historial de palabras buscadas (para poder repasarlas más tarde) o uso real de las palabras en Twitter, por ejemplo.

Así pues, aprovecho la mayor parte del trabajo realizado por entonces: extracción de una base de datos de palabras, sus frecuencias, servicios de traducción y pronunciación (Forvo dispone de una API muy útil), ejemplos, etc. Realmente voy a descartar algunos de los servicios que quise añadir en su momento, como búsquedas de la palabra en Internet (con la API de Yahoo) porque en este caso no es tanto un “diccionario con esteroides”, sino un lugar en el que aprender nuevo vocabulario mientras consumes ocio en el idioma real.

La idea, por cierto, es automatizar – al máximo – todo el proceso (extracción de palabras, generación de ejercicios, filtrado de contenidos), por lo que el proyecto se convierte en todo un reto para mí como desarrollador.

  • Las palabras las extraemos de Wiktionary, N-Grams de Google y otras ontologías
  • Los vídeos de YouTube, de su API, a la cual podemos llamar con el parámetro “videoCaption”, que nos devolverá únicamente vídeos con subtítulos (de los cuales extraeremos las palabras a estudiar)
  • Para los artículos probablemente tengamos que añadir manualmente los selectores DOM que nos traigan el cuerpo / título del artículo y tengamos que realizar un filtrado previo de qué medios queremos utilizar.

A continuación voy a colocar unos wireframes de cómo veo que sería el comportamiento de la aplicación (sin extras todavía como login de usuarios, gamificación, historial de palabras estudiadas, etc.).

1. Home

En una primera versión la home será un listado “infinito” de contenidos para los cuales ofrecemos una serie de palabras a aprender con ellos.
1. Home

2. Contenido (I): Selección de palabras

Un listado de 5-10 palabras que el usuario podrá modificar para seleccionar las palabras que más le interese aprender. Ya que el proceso de extracción de palabras será automático, esto ayudará a que las palabras a estudiar sean las óptimas para el estudiante.

2. Select Words

3. Contenido 2: Ejercicios

Una serie de cards de ejercicios al más puro estilo DuoLingo con el que el usuario aprenderá el uso de las palabras.

3. Exercises

4. Contenido 3: Visualización

En esta vista el usuario ya visualiza el contenido (vídeo con los subtítulos/artículo) junto con un resumen de las palabras y su significado / traducción. Esta sería la vista objetivo de todo este proyecto, ya que es el momento en el que el estudiante consume contenidos reales en los que se hace uso de las palabras estudiadas.

4. Watch Video
En mente tengo muchos añadidos:
  • Búsqueda: el usuario busca una palabra y el sistema le devuelve contenidos reales en los que se utiliza esa palabra.
  • Historial: cada palabra estudiada queda guardada en un historial que se puede volver a repasar para recordar las palabras estudiadas.
  • Subtítulos de películas y series: este proyecto realmente nació con la intención de crear ejercicios que consumir antes de visualizar series en VO. Imagínate ver un capítulo de Game of Thrones para el que, además, has estudiado 5-10 minutos antes, aquellas palabras que no conocías. El problema de las pelis y las series es que el idioma rey es el inglés y es poco escalable al aprendizaje de otros idiomas.
  • Gamificación: otorgar puntos por cada contenido visualizado / ejercicio hecho, para lograr que el usuario sienta aún más que cada ejercicio realizado le ayuda a aprender.
  • Idiomas: de momento empezamos con el francés. Los siguientes idiomas a añadir serían: inglés, español, alemán, italiano y molaría en un futuro añadir idiomas como ruso, japonés o chino. Euskera no lo descarto tampoco y otros idiomas regionales como catalán (el uso del dominio .cat igual me “obliga” a hacerlo antes) o el gallego.
Si te interesa, el proyecto está subido en mi GitHub:
https://github.com/ojoven/wordscat

Próximamente iré contando más novedades.
Espero, por cierto, que este proyecto no se vuelva a quedar colgado en el candelero como muchos otros. Es cierto que tengo ciertas dudas de la consecución de este proyecto porque su alcance es bastante amplio y aún queda mucho por hacer. Amadeus, el último proyecto del que hablé aquí no lo he terminado ni tengo intención de hacerlo, por cuestiones de prioridad.

Salut !

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>