无限重掷骰子的收益期望
probability - Expected value of game involving 100-sided die - Mathematics Stack Exchange
题干
给定已知概率分布\(D\),记第一次采样结果为\(a_1\)。你可以:
- 接受该采样,获得收益\(a_1\);
- 拒绝该采样,花费\(k\)(\(k>0\))的代价重新采样,记第二次采样结果为\(a_2\);
然后你可以接受\(a_2\),获取等量的收益,或者再次花费\(k\)的代价重新采样。重新采样次数无限制。
请给出一个最优策略,最大化获得的收益,并计算该策略下收益的数学期望。
特例:\(D\)为整数集\(\{1, \dots, 100\}\)上的均匀分布,\(D=U(1,100)\)等。