![poli]<br> IPN-UPIITA

IPN-UPIITA

Redes Neuronales

Reporte R04

Dr. Rafael Martínez Martínez

Academia de sistemas

ramartinezr@ipn.mx

Instrucciones:

Cada problema/ejercicio debe tener procedimiento ordenado y completo que justifique adecuadamente la respuesta anotada.

Si falta el procedimiento o este no justifica la respuesta anotada entonces el problema vale 0 puntos aunque la respuesta sea correcta.

Problema 1 (50 puntos)

La Figura 1 fue tomada del articulo: Why Momentum Really Works. La Figura 1 muestra la trayectoria de la sucesión de búsqueda del mínimo para una función cuadrática (no especificada) y un punto inicial (interactivo). En particular la trayectoria es la generada por el algoritmo de momentum para sus parámetros¹ (Step-size) y (momentum). La entrega consiste en responder preguntas respecto a la primer parte del articulo². Lo ideal es que dieras una primer lectura a todo la información y después contestaras regresando a la información especifica de la pregunta.

Sin mover el punto de inicio. Reporta gráficas para las Figuras generadas por al aplicacion para los siguientes casos
1. y
2. y
3. y
4. y
5. y
¿Cuáles son tus primeras impresiones al respecto?
En los algoritmos vistos en clase hablamos de la tasa de aprendizaje ¿Cuál es el nombre que recibe este parámetro en el articulo?
Anotas las ecuaciones que se refieren al algoritmo de momentum. En este punto debería tenerse claro en donde intervienen los parámetros y antes utilizados.
¿Qué sucede si en la Figura 2 el punto de inicio está en la linea de acción del vector propio? Reporta la figura que ilustre esto.

Figura 2. Trayectoria de gradiente descendiente
Para el algoritmo de gradiente descendiente puede caraterizarse el vector de error³ en cada iteración en términos de las componentes de la condición inicial, , los valores propios y los vectores propios (se a supuesto una forma cuadrática), es decir

(1)

de forma similar, se puede caracterizar al error entre la evaluación de la función en la iteración y la evaluación en el mínimo

(2)

Explica la Figura 3 a detalle (todos los elementos gráficos son la ayuda). Puede servir mover los valores del Step-size para entender mejor la gráfica

Figura 3. Geometría del error de evaluación
¿Por qué garantiza convergencia?
Explica que es una tasa. Hay muhcos contextos para ello, en particular reporta que es la tasa de convergencia de una sucesión (podrías encontrarlo como tasa de convergencia de un algoritmo). La idea es tener claro lo que sigue
Reporta el valor óptimo de y el valor óptimo de la tasa. Para concluir esta sección se debe tener en mente que cuando el algoritmo de gradiente descendiente tiene comportamientos no deseados.
Debido al background que tenemos la sección: Example: Polynomial Regression, puede ser difícil de leer, se porporcionan algunos elementos para que lectura sea más digerible. Lo sección es un ejemplo diferente para ilustrar un fenómeno que se desprende de lo abordado en el pregunta v.

Si tenemos los polinomios , el vector , puede ser expresado por el vector de coordenadas en (como espacios vectoriales son isomorfos). Así se puede hacer la asiciación de bases , y . Así un problema que involucre propiedades de espacio vectorial en en el espacio de polinomios, puede trasladarse a un problema en , donde depende del grado del polinomio

Supongamos que tenemos las sigueintes mediciones

(las x) (las y)

Supongamos que queremos encontrar la mejor combinación lineal dada por

De tal forma que los minimicen la siguiente expresión, esat expresión hace referencia a la suma de los errores al cuadrado entre el valor observado y el calculado con el modelo propuesto (es este sentido será la mejor combinación lineal)

Con ayuda de la sección correspondiente del articulo y lo anterior. Escribe , y para el ejemplo antes planteado. A este punto debe de quedar clara la equivalencia entre la suma y la forma matricial.

La sección va en esta dirección, se busca encontrar que minimice la expresión del error. Así, si se hace una cambio de base o cualquier trasformación de esta en se vera reflejado en la correspondiente base de polinomios y viceversa. Observemos que queremos minimizar una forma cuadrática en .
Explica las Figuras 4, 5 y 6. Resume las conclusiones de la sección correspondiente. La mejor forma de entender es manipular los elementos gráficos de las aplicaciones. Además recuerda que siempre puedes buscar información adicional.

Problema 2 (50 puntos)

Ingresa al siguiente curso Introduction to Machine Learning⁵. Revisa la información ubicada en Week 4: Margin Maximization. Es necesario decir que no se vale revisar las soluciones 😄. Pero si puedes comprobar las veces que sea necesario tu resultado con la herramienta proporcionada en la plataforma 😀. No se supervisa la revisión del material indicado, pero ojalá esta se realice.

La entrega consiste en

Resolver Week 4 Exercises. Los resultados de tu calificación en la plataforma, deben de poderse visualizar dentro de one-note.
Resolver Week 4 Lab. Los resultados de tu calificación en la plataforma, deben de poderse visualizar dentro de one-note.

^1.Valores aproximados, pues hay un error en la visualización inicial que indican , , si se intenta probar con los valores corregidos se aproxima a la Figura mostrada inicialmente en la aplicación ↩

^2.La segunda prte del articulo se entregará en el siguiente reporte ↩

^3.La diferencia entre la aproximación (en el paso ) y el mínimo ↩

^4.De ahi se desprende que , visto en clase ↩

^5.La creación de una cuenta e ingresar al curso es gratis ↩

(las x)	(las y)