niche网站建设百度图片
( A, B )---3*30*2---( 1, 0 )( 0, 1 )
做一个网络让输入只有3个节点,每个训练集里有4张图片,让B的训练集全为0,排列组合A,观察迭代次数平均值的变化。
A-B | 迭代次数 | |||
0 | 1 | 0 | 2*0*0*7-0*0*0*0 | 12957.31 |
0 | 0 | 0 | 2*0*0*7-0*0*0*0 | 12957.31 |
0 | 0 | 0 | 2*0*0*7-0*0*0*0 | 12957.31 |
1 | 1 | 1 | 2*0*0*7-0*0*0*0 | 12957.31 |
0 | 0 | 0 | 0*2*0*7-0*0*0*0 | 13891.66 |
0 | 1 | 0 | 0*2*0*7-0*0*0*0 | 13891.66 |
0 | 0 | 0 | 0*2*0*7-0*0*0*0 | 13891.66 |
1 | 1 | 1 | 0*2*0*7-0*0*0*0 | 13891.66 |
0 | 0 | 0 | 0*0*2*7-0*0*0*0 | 14571.38 |
0 | 0 | 0 | 0*0*2*7-0*0*0*0 | 14571.38 |
0 | 1 | 0 | 0*0*2*7-0*0*0*0 | 14571.38 |
1 | 1 | 1 | 0*0*2*7-0*0*0*0 | 14571.38 |
尽管大部分的形态的排序无法解释,但是当有1行全为0的情况确很容易解释,如上的三个网络A的4张图片都相同,仅仅是顺序不同,迭代次数看起来就是和这4个点的势能成反比。
0 | 1 | 0 | 2*0*0*5-0*0*0*0 | 33514.82 |
0 | 0 | 0 | 2*0*0*5-0*0*0*0 | 33514.82 |
0 | 0 | 0 | 2*0*0*5-0*0*0*0 | 33514.82 |
1 | 0 | 1 | 2*0*0*5-0*0*0*0 | 33514.82 |
0 | 0 | 0 | 0*2*0*5-0*0*0*0 | 34049.09 |
0 | 1 | 0 | 0*2*0*5-0*0*0*0 | 34049.09 |
0 | 0 | 0 | 0*2*0*5-0*0*0*0 | 34049.09 |
1 | 0 | 1 | 0*2*0*5-0*0*0*0 | 34049.09 |
0 | 0 | 0 | 0*0*2*5-0*0*0*0 | 34108.71 |
0 | 0 | 0 | 0*0*2*5-0*0*0*0 | 34108.71 |
0 | 1 | 0 | 0*0*2*5-0*0*0*0 | 34108.71 |
1 | 0 | 1 | 0*0*2*5-0*0*0*0 | 34108.71 |
1 | 1 | 1 | 7*2*2*0-0*0*0*0 | 9031.915 |
0 | 1 | 0 | 7*2*2*0-0*0*0*0 | 9031.915 |
0 | 1 | 0 | 7*2*2*0-0*0*0*0 | 9031.915 |
0 | 0 | 0 | 7*2*2*0-0*0*0*0 | 9031.915 |
0 | 0 | 0 | 0*2*7*2-0*0*0*0 | 9460.678 |
0 | 1 | 0 | 0*2*7*2-0*0*0*0 | 9460.678 |
1 | 1 | 1 | 0*2*7*2-0*0*0*0 | 9460.678 |
0 | 1 | 0 | 0*2*7*2-0*0*0*0 | 9460.678 |
0 | 1 | 0 | 2*2*7*0-0*0*0*0 | 9948.558 |
0 | 1 | 0 | 2*2*7*0-0*0*0*0 | 9948.558 |
1 | 1 | 1 | 2*2*7*0-0*0*0*0 | 9948.558 |
0 | 0 | 0 | 2*2*7*0-0*0*0*0 | 9948.558 |
随着迭代次数的增加,那个大质量的部件最终沉降到整个结构的最底部,整个系统的势能达到最低。
0 | 0 | 0 | 0*7*3*1-0*0*0*0 | 8041.432 |
1 | 1 | 1 | 0*7*3*1-0*0*0*0 | 8041.432 |
0 | 1 | 1 | 0*7*3*1-0*0*0*0 | 8041.432 |
0 | 0 | 1 | 0*7*3*1-0*0*0*0 | 8041.432 |
0 | 0 | 0 | 0*5*7*4-0*0*0*0 | 8475.513 |
1 | 0 | 1 | 0*5*7*4-0*0*0*0 | 8475.513 |
1 | 1 | 1 | 0*5*7*4-0*0*0*0 | 8475.513 |
1 | 0 | 0 | 0*5*7*4-0*0*0*0 | 8475.513 |
0 | 0 | 0 | 0*1*7*3-0*0*0*0 | 8676.719 |
0 | 0 | 1 | 0*1*7*3-0*0*0*0 | 8676.719 |
1 | 1 | 1 | 0*1*7*3-0*0*0*0 | 8676.719 |
0 | 1 | 1 | 0*1*7*3-0*0*0*0 | 8676.719 |
1 | 1 | 0 | 6*2*7*0-0*0*0*0 | 9031.211 |
0 | 1 | 0 | 6*2*7*0-0*0*0*0 | 9031.211 |
1 | 1 | 1 | 6*2*7*0-0*0*0*0 | 9031.211 |
0 | 0 | 0 | 6*2*7*0-0*0*0*0 | 9031.211 |
0 | 0 | 0 | 0*1*3*7-0*0*0*0 | 9135.643 |
0 | 0 | 1 | 0*1*3*7-0*0*0*0 | 9135.643 |
0 | 1 | 1 | 0*1*3*7-0*0*0*0 | 9135.643 |
1 | 1 | 1 | 0*1*3*7-0*0*0*0 | 9135.643 |
这组过程由5个网络组成,细节更为生动,3张图片只能有5个不同的能级在这里都有体现。
这一现象让人浮想联翩,容易让人觉得神经网络的训练的过程就是在计算一个形态在另一个形态中的最低能级。这个所谓的最低能级包括但不限于势能,能级越低越稳定,迭代次数越大,所谓的迭代次数描述了A-B复合结构的一种稳定性。