Aunque me has dicho que has entendido la explicación, yo creo que no y te digo porqué. Sigues hablando de imagen de entrenamiento, y del número de éstas. No hay imagen de entrenamiento, la red no se entrena con una imagen se entrena con filas de una tabla donde se hace coincidir a un trío de números RGB su correspondiente trío de números de salida. Si he usado esas combinaciones en forma de imagen ha sido solo por comodidad, podrían ser datos en un Excel y daría lo mismo.
Y esos datos representan todas las posibles combinaciones de color RGB que la red tendrá que predecir, por lo tanto no vamos a predecir nada a lo que la red no haya sido expuesta durante su entrenamiento. Uniendo esto al hecho de que no hay ruido (la salida para cada combinación de entrada es justo la que debe ser, de forma determinista), el overfitting no solo no nos preocupa sino que es deseable porque buscamos que la red se aprenda lo más fielmente posible la función de transformación.
Salu2!
Enviado desde mi PRA-LX1 mediante Tapatalk