Construyendo sistemas autónomos con Microsoft AI

Hoy en día, la inteligencia artificial y el aprendizaje automático ofrecen oportunidades y desafíos únicos para automatizar sistemas industriales complejos. Y está llegando un nuevo paradigma para ayudarnos a lograrlo, me refiero a la “enseñanza de la máquina”. MT nos ayuda a construir sistemas ML, alejando el enfoque de los algoritmos y dirigiéndonos a la generación e implementación de modelos exitosos.

La enseñanza de máquinas infunde experiencia en la materia en el entrenamiento automatizado de sistemas de IA … con aprendizaje de refuerzo profundo (DRL) y simulaciones. Al abstraerse de la complejidad de la IA para centrarse en la experiencia en la materia y las condiciones del mundo real, se crean modelos que convierten los sistemas de control automatizados en sistemas autónomos.

Reinforcement Learning

Cuando hablamos de aprendizaje por refuerzo, podemos hablar de cómo queremos entrenar a un agente para que realice alguna tarea. Intentemos comprender mejor cómo funcionan las cosas … en este ejemplo, un agente puede ser un automóvil, un dron, un robot, etc. y ese agente va a interactuar con el entorno tomando acciones … la acción va a hacer la transición del entorno a un nuevo estado … … y el agente va a recibir ese nuevo estado más alguna recompensa que determina qué tan buena o mala esa acción estaba.

image

Su objetivo es aprender a maximizar esa recompensa para encontrar la política que haga que esa recompensa tenga la puntuación más alta.

En otro ejemplo

image

1.Un agente, actor o cerebro, en este caso un robot, realiza una acción en un entorno, en este caso, una línea de fabricación inteligente.

2. La acción hace que el entorno cambie de estado y devuelva su estado cambiado al agente.

3.Un mecanismo de evaluación aplica una política para determinar qué consecuencia entregar al agente.

4.El mecanismo de recompensa fomenta las acciones beneficiosas al entregar una recompensa positiva y puede desalentar las acciones negativas al generar una penalización.

5. Las recompensas hacen que las acciones deseadas aumenten, mientras que las penalizaciones hacen que las acciones no deseadas disminuyan.

En nuestro próximo post veremos la propuesta de Microsoft para el desarrollo de Sistemas autónomos. Proyecto Bonsai.

0 0 vote
Calificación de la Publicación

tilcaivana

View all posts
Subscribe
Notify of
guest
0 Comentarios
Inline Feedbacks
View all comments

Próximos Eventos

  • No hay eventos

Suscríbete a IA en Español

Comentarios Recientes

0
Would love your thoughts, please comment.x
()
x