有趣的大素数分布统计
素数,飘忽不定、乱云飞渡。
素数,普遍认为的分布规律是没有规律。
素数,时而连续,时而相隔很远。
有远亲、有近邻。
人们已经习惯了小区间的素数分布情况,并认可其为真理,比如以下几点:
1、统计10以内有4个素数,素数占40%,100以内有25个素数,素数占25%,1000以内有168个素数,素数占16.8%。
这种观念和方法可以说是根深蒂固。
当然“素数越来越稀少”这个结论更是牢不可破。
2、以10倍增长来考察素数分布规律。
几乎所有关于素数个数统计的文章中都是按照10,100,1000,10000等10倍增长来统计相应自然数内的素数个数。
而在大区间情况又是怎样的呢?它和我们头脑中的素数观一致吗?还是列举一些实例吧,体会一下也许与上述小区间素数观念不一样的素数观。
先列出10000附近的素数来体会,虽然数字太小,但也许还是可以发现一些端倪的。
这里将相邻两个区间按照排列顺序简称为前区和后区。
首先展示自然数10000左右的素数分布情况。
以10000为中心,以100为区间大小。
也就是说9900-10000为前区,10000-10100为后区。
在前区素数个数为9个,后区为11个,前后区个数比值为0.82。
两者结果相差18%。
而若以1000为区间大小,前区为112个后区为106个,前后区个数比值为1.06。
相差还是有些大的。
如果非常认真的人一定会认为两区间所含素数个数相差很大,而一些马马虎虎的人就可能认为两者差不多吧。
相同的统计结果在不同的人群中还是可能有些认知差别的。
那还是看一下大数字下的素数统计分布情况。
以下统计都是以100亿为中心,以100亿的1%为区间大小,也就是说个前后两个区间长度各为1亿。
下面按素数、孪生素数、三胞胎素数、四胞胎素数分述如下:
一、素数的分布
前后区分别包含4343734和4341930个素数,前后区个数比值为1.0004,仅仅相差0.04%。
与前文自然数10000时“相差16%”的统计结果中可以说是天壤之别了。
前后区分别包含了1086253和1085898个个位为1的素数,前后区个数比值为1.0003;前后区分别包含了1086064和1084787个个位为3的素数,前后区个数比值为1.0012;前后区分别包含了1086118和1085574个个位为7的素数,前后区个数比值为1.0005;前后区分别包含了1085299和1085671个个位为9的素数,前后区个数比值为0.9997。
二、孪生素数的分布:
孪生素数可以按照个位分成3个类型,个位为1和3的称之为13型孪生素数,此外还有79型孪生素数,91型孪生素数。
前后区分别包含了249141和248981个孪生素数,前后区个数比值为 1.0006。
其中,前后区分别包含了83234和83286个13型孪生素数,前后区个数比值为0.9994;前后区分别包含了82830和83060个79型孪生素数,前后区个数比值为0.9972;前后区分别包含了83077和82635个91型孪生素数,前后区个数比值为1.0053。
可以看到两个相邻各1亿区间内的孪生素数数量基本一致。
两组13型孪生素数间距最短距离是30,比如41-43和71-73就是一对相差30的13型孪生素数。
此外还有相差60、90等许多种间距的孪生素数,在99亿-101亿区间内13型孪生素数彼此最短间距为30,最长间距为15180。
这里仅列举相差30、60、90的13型孪生素数在前后区分布情况:间距30的13型孪生素数前后区分别是1983和1951对,前后区个数比值为1.0164。
间距60的13型孪生素数前后区分别是1589和1542对,前后区个数比值为1.0305。
间距90的13型孪生素数前后区分别是1698和1674对,前后区个数比值为1.0143。
可以看到在两个相邻区间内,不但孪生素数个数是相近的,就是孪生素数之间的间距统计也是非常接近一致的。
三、三胞胎素数
前后区分别包含了11774和11707个三胞胎素数,前后比值为1.0057。
三胞胎素数在99亿-101亿区间内最短间距为30,最长间距为74790。
间距30的三胞胎素数前后区分别是41和38对,前后区个数比值为1.0789。
间距60的三胞胎素数前后区分别是29和31对,前后区个数比值为0.9355。
间距90的三胞胎素数前后区分别是26和26对,前后区个数比值为1。
四、四胞胎素数
前后区分别包含了1458和1512个四胞胎素数,前后区个数比值为0.9643。
四胞胎素数在99亿-101亿区间内最短间距为30,最长间距为692460。
间距30的四胞胎素数前后区各有1对,前后区个数比值为1。
这两对四胞胎素数分别是:997072018-997072021和1005072304-1005072307(此处四胞胎素数均不包含个位数字1、3、7、9,故可以用1个数字代替,完整的一组四胞胎素数应填上这些个位,并形成个位不同的4个数字)。