La Figura 1 fue tomada del articulo: Why Momentum Really Works. La Figura 1 muestra la trayectoria de la sucesión de búsqueda del mínimo para una función cuadrática (no especificada) y un punto inicial (interactivo). En particular la trayectoria es la generada por el algoritmo de momentum para sus parámetros1 (Step-size) y (momentum). La entrega consiste en responder preguntas respecto a la primer parte del articulo2. Lo ideal es que dieras una primer lectura a todo la información y después contestaras regresando a la información especifica de la pregunta.
Sin mover el punto de inicio. Reporta gráficas para las Figuras generadas por al aplicacion para los siguientes casos
¿Cuáles son tus primeras impresiones al respecto?
En los algoritmos vistos en clase hablamos de la tasa de aprendizaje ¿Cuál es el nombre que recibe este parámetro en el articulo?
Anotas las ecuaciones que se refieren al algoritmo de momentum. En este punto debería tenerse claro en donde intervienen los parámetros y antes utilizados.
¿Qué sucede si en la Figura 2 el punto de inicio está en la linea de acción del vector propio? Reporta la figura que ilustre esto.
Para el algoritmo de gradiente descendiente puede caraterizarse el vector de error3 en cada iteración en términos de las componentes de la condición inicial, , los valores propios y los vectores propios (se a supuesto una forma cuadrática), es decir
de forma similar, se puede caracterizar al error entre la evaluación de la función en la iteración y la evaluación en el mínimo
Explica la Figura 3 a detalle (todos los elementos gráficos son la ayuda). Puede servir mover los valores del Step-size para entender mejor la gráfica
¿Por qué garantiza convergencia?
Explica que es una tasa. Hay muhcos contextos para ello, en particular reporta que es la tasa de convergencia de una sucesión (podrías encontrarlo como tasa de convergencia de un algoritmo). La idea es tener claro lo que sigue
Reporta el valor óptimo de y el valor óptimo de la tasa. Para concluir esta sección se debe tener en mente que cuando el algoritmo de gradiente descendiente tiene comportamientos no deseados.
Debido al background que tenemos la sección: Example: Polynomial Regression, puede ser difícil de leer, se porporcionan algunos elementos para que lectura sea más digerible. Lo sección es un ejemplo diferente para ilustrar un fenómeno que se desprende de lo abordado en el pregunta v.
Si tenemos los polinomios , el vector , puede ser expresado por el
vector de coordenadas en (como espacios vectoriales son isomorfos). Así se puede hacer la asiciación de bases
, y . Así un problema que involucre propiedades de
espacio vectorial en en el espacio de polinomios, puede trasladarse a un problema en , donde depende del grado del polinomio
Supongamos que tenemos las sigueintes mediciones
(las x) | (las y) |
---|---|
Supongamos que queremos encontrar la mejor combinación lineal dada por
De tal forma que los minimicen la siguiente expresión, esat expresión hace referencia a la suma de los errores al cuadrado entre el valor observado y el calculado con el modelo propuesto (es este sentido será la mejor combinación lineal)
Con ayuda de la sección correspondiente del articulo y lo anterior. Escribe , y para el ejemplo antes planteado. A este punto debe de quedar clara la equivalencia entre la suma y la forma matricial.
La sección va en esta dirección, se busca encontrar que minimice la expresión del error. Así, si se hace una cambio de base o cualquier trasformación de esta en se vera reflejado en la correspondiente base de polinomios y viceversa. Observemos que queremos minimizar una forma cuadrática en .
Explica las Figuras 4, 5 y 6. Resume las conclusiones de la sección correspondiente. La mejor forma de entender es manipular los elementos gráficos de las aplicaciones. Además recuerda que siempre puedes buscar información adicional.
Ingresa al siguiente curso Introduction to Machine Learning5. Revisa la información ubicada en Week 4: Margin Maximization. Es necesario decir que no se vale revisar las soluciones 😄. Pero si puedes comprobar las veces que sea necesario tu resultado con la herramienta proporcionada en la plataforma 😀. No se supervisa la revisión del material indicado, pero ojalá esta se realice.
La entrega consiste en
Resolver Week 4 Exercises. Los resultados de tu calificación en la plataforma, deben de poderse visualizar dentro de one-note.
Resolver Week 4 Lab. Los resultados de tu calificación en la plataforma, deben de poderse visualizar dentro de one-note.
1.Valores aproximados, pues hay un error en la visualización inicial que indican , , si se intenta probar con los valores corregidos se aproxima a la Figura mostrada inicialmente en la aplicación ↩
2.La segunda prte del articulo se entregará en el siguiente reporte ↩
3.La diferencia entre la aproximación (en el paso ) y el mínimo ↩
4.De ahi se desprende que , visto en clase ↩
5.La creación de una cuenta e ingresar al curso es gratis ↩