手机浏览器扫描二维码访问
ai的蒙特卡罗算法,用童话故事讲解。
我们用一个童话故事的方式来解释ai中的蒙特卡罗算法(nte
carlo
algorithm),特别是它在博弈论、游戏ai、决策模拟等场景中的应用。
?
童话故事:小狐狸奇奇的果子冒险
很久很久以前,在一个叫做“决策森林”的神奇世界里,住着一只聪明又调皮的小狐狸,名字叫奇奇。
每天清晨,森林里都会出现很多果子树,不同的路径会通向不同的果子。奇奇最喜欢吃红果子,但问题是:有些红果子很甜,有些很苦,而且你不走近去尝一尝,是无法知道的!
而且,森林的路径像迷宫一样复杂,一次只能走一步,一共只能走
10
步。奇奇每天都要做一个决定:要走哪条路,去哪里找果子吃,怎样才能吃到最多好吃的果子?
这对奇奇来说太难了!
?
这时,ai之神悄悄给奇奇一个神奇的法宝:
这法宝名字叫做:
蒙特卡罗模拟法(nte
carlo
simulation)
这个法宝可以让奇奇提前“幻想”几千次自己的走法和吃果子的结果,然后选择最可能成功的那一条。
?
奇奇使用蒙特卡罗模拟的方法如下:
第一步:随便乱走1000次!
奇奇在脑海里幻想自己从现在出发,一直走10步,每次都随机选一个方向。每一条幻想路线都叫做一次模拟。
就像在现实生活中掷骰子做决策那样,蒙特卡罗方法通过“随机”走法来覆盖各种可能。
每次模拟结束后,奇奇会记录下:
?
自己最后吃到了哪些果子?
?
是甜的还是苦的?
?
总共吃了多少好吃的?
第二步:把所有模拟的结果记录下来!
奇奇发现,有一些起始方向,比如往左边走,虽然开始没果子,但最终常常会碰到一大堆红果子树。
而往右走,虽然开始就有果子,但走到第6步就没什么了。
第三步:统计谁最好!
奇奇统计所有模拟中,“哪个第一步方向”最终吃到了最多的甜果子,于是决定——
“我这次就往那个方向走吧!”
这就是蒙特卡罗算法的核心逻辑:
?
用随机采样的方式探索未来的可能性;
海贼:洛克斯时代第一剑豪! 玉孤 穿越兽世,日日扶腰求放过 迷雾中的真相:侦探手记 我是赵梦凡 神谕之十二生肖 叶尘:重生在赘婿逆袭之路 开局表白女神,一剑震撼万族 夺我灵根骂我狠?先天绝情圣体已成! 黑芒科技之途 崩坏:从西琳开始捕获小小律者 重生后被亿万富豪逼婚,渣男傻眼 尸之仙 银镜通古今,侯府真千金带崽开挂了! 女将带球跑后,死对头一夜哭白头 盗墓:无故失忆后我直接发癫 重回1978都市放牛 穿越之异世奇遇迹 开局校花太太向我道歉,东京末日 吞天仙根
一场人质救援行动中,因为救援失败而一蹶不振的龙牙队员张正选择退役归隐,此后国家神秘的龙牙小组真正意义上失去了最尖锐的兵器。几年后的张正再次出现势必要将这世界搅动得天翻地覆。...
蜀山有玄门正宗,一家独大。主角修炼的是魔门正宗。群号紫云宫22117110。...
下载客户端,查看完整作品简介。...
市一高新丁黄景耀因得罪骨干教师被恶意针对,不堪受辱辞职后意外得到仙家至宝。重新执教县一高,左手录运簿册掌天下文章,可查看每一个学生学习天赋,提升天赋。右手文昌大印掌考场气运,财富官运。教师以教育水平和升学率为本,黄景耀渐渐发现他的本钱雄厚的有些令人发指,一次次撼动整个教育界,又远不止单一的教育界。...
聚焦巅峰火爆畅销他是世界闻名的巅峰杀手,却被家族逼婚,与美女总裁住在了一起。彼此看不顺眼却又不得不同居,萧凡决定回学校散散心,可是...
被继母逼迫,她走投无路,和神秘富豪签定协议嫁进豪门。婚后三年,富豪老公把她宠上天。只除了没有生下继承人。豪华别墅里,裴七七气愤地将报纸砸在男人身上这上面说我是不下蛋的母鸡,唐煜,明明就是你的问题。男人放下报纸,一本正经地赞同小妻子的话怎么能乱写呢,你分明属猪!唐!煜!她气得跳脚!男人轻笑有没有孩...