Dos ejercicios (propuestos) sobre «embeddings»

Se me han ocurrido en los dos últimos días un par de ejercicios sobre embeddings que no voy a hacer. Pero tal vez alguien con una agenda más despejada que la mía se anime. Uno es más bien tonto; el otro es más serio.

El primero consiste en tomar las provincias, los códigos postales o las secciones censales y crear textos que sean, para cada una de ellas, las colindantes. Luego, construir un embedding de dimensión 2. Objetivo: probar o refutar que el embedding es una transformación de las coordenadas geográficas de las unidades geográficas. Bonus: ver qué pasa con embeddings de dimensión superior.

El segundo es comprobar experimentalmente si lo que dice el artículo que comenté aquí es cierto o no. Es decir, tomar un embedding cualquiera, construir la matriz m_{ij} = w_ic_i y ver si tiene la forma que aseguran los autores del artículo.