六合是個隨機的東東,一切統計理論都是二重性,看起來理由充足,卻也存在一擊即破的致命缺點。本文既可以說是統計教程,亦可稱爲雜談!未切入正題前先潑冷水,說些不中聽的:
一:統計是一種很平常甚至很差的方法
統計只是一種出碼或殺碼的方法,並沒什麽神奇之處,看碼報看電視看日曆牌數星星猜特都比統計精准得多。網上到處都能看到什麽無錯呀今年錯一之類的厲害高手,想在統計中找個殺10碼10錯一都罕見,見得最多是某某突然研究出個新方法,稱10中9.9不是問題,最後這種高手都是幾期後消失無影無蹤到天堂發財了。除了在櫃底翻出來唬人的記錄,網上這麽多人實際發表,沒幾個統計可以值得使用,統計就算不是垃圾也攀不上高級,和大部分人亂統幾期就自稱數理派滿口概率一副高手自居的身份極不相稱。
二:統計是效率最低的方法
所有方法中,最費時就是統計,要是把材料收集處理統計綜合全包,還有對方法驗證。一期花10多個小時的不在少數。花時間越多,有時是爲了求個心理上的安慰,下注時用的結果不一定是最穩的,卻往往是最費時的。所以說統計是效率最低的取碼方法。
三:中率無用論
幾乎99.98%的人都在用材料命中率估算來進行統計,每個人都有自己一套看起來很過關的理論來支持統計,事實上一千種方法,也只能歸類爲正殺,反殺和正反綜合三種,論壇材料是各個位置都均勻出特的,用固定殺就是在等死,而且綜合越多越是接近數據直統結果,淹沒了分組挑殺的優點。用簡單統計還是複雜綜合一直是困繞著統計者的矛盾。所以說命中概率統計做得越深,結果越差,導致統計者方法不斷變換,在命中率的怪圈裏找方法呀驗算呀,花時間又燒錢還找苦惱。
說完壞話,轉入正題,還得以命中率爲基礎來做統計的,嘿嘿
一:認識特圍材料的特性
材料分析是統計的基礎,不熟悉材料特征,一切統計都是空談,甚至會與統計前的設想相反。
1,出特範圍
◆ 高中率盲區
統計前,幾乎所有的人都要去查找和計算所選材料的中率,並以此爲依據對目標範圍進行統計
而98%的人都會不自覺地把目光停留在記錄特別好的材料上,或者因發表者刪差留好的面子原因,和自身喜好厭差而忽略對差料的分析甚至淡忘,心理上就産生一種論壇材料偏好的印象。這個盲點會導致統計者盲目樂觀和統計方向失誤。
◆ 平均中率計算
平均中率是統計的一個指導系數,但這個簡單的系數卻沒有幾個人去正確理解。
很多人都是去看那些高手的記錄達到多高,憑記錄來做未來中率判斷,這種虛高的中率,會害死自己。
正確而又最簡單計算平均中率是:平均殺碼數/49碼,如35碼圍,中率是35/49=71.4%,平均殺14碼的出錯率是14/49=28.6%.
只要有一定數量的圍(如100個以上)和足夠長的周期(如30-40期),把出錯次數除以總發表次數,得出的結果和用平均碼數/49碼的值,誤差不會超過2%。篇幅有限這兒就不詳細計算了,有對此計算懷疑或興趣的朋友可以隨便找一個特圍區的加星榜計算一下,加星榜是實際發表的記錄,用來計算是最准確的了。計算方法可用TXT文檔替換,如用1替換★,0替換☆,會顯示多少個被替換,再計算一下就行了。平均中率的值,用在單個圍的判斷也是有用的,固定方法計算的圍,長期成績會趨向平均,如一個35碼圍,前面20期錯2成績達90%,在未來很難保持這麽高中率的,正常是出錯增大,下個20期會錯4以上,向35/49=71.4%靠攏而不是遠離,同樣,一個10錯5的圍,下一個10期還錯6,就是奇觀了。把成績好的圍組合同殺的來殺碼,受傷的例子很多的。
◆ 波動範圍和統計目標範圍圈定
數據量足夠大,可以求得平衡,但並不是期期開中心次那麽理想,甚至中心次附近的小範圍所占的比例也不高。特圍數據是動態平衡,跟蹤數據直統會發現,號碼集中在中心次+-10%,而出特更爲集中在中心次+-5%。
綜合分析,會發現出特位置很均勻,各個位置都會開出,且比例相當,只是不同時期小有變化,事實上這是大規律,不論是以網上某個特圍區的局部數據,或是高中率爲標准選擇收集,或是以發表時間早的所謂原創料收集,在時間跨度超過30期後,都顯現均勻分布。
從統計角度來看,目前99%的人都在沿用較爲直觀的命中概率統計,並以正殺爲主。中率統計有明顯的缺陷,一是手段單一,不論多複雜巧妙的理論,在轉化成結果後,都只能歸爲正殺,反殺和正反綜合三大類,二是取殺位置固定,這個拿數據直統和自己統計後的統計表對比就看得出了,基本是同殺某個位置的大多數號碼。說得不好聽就是在等死,一種殺法的理論是每期有1/3機會出錯。也是這個原因,網上想找個10錯1的殺10-15碼非常難,而那些一想出個看似很穩的方法就號稱十中八九的高手,在用心跟蹤幾十期的直統規律,對比自己統計和直統位置,不知有何感想。
不過中率統計被用得最爲廣泛,是有其優勢的,方法直觀易被接受,用的人多,開發得最爲系統,論壇材料統計有個趨勢,由新哥到老貓,發表結果會由殺碼轉換到範圍出碼,原因一是水平提高,能從單一殺碼進步到穩定出碼,二是中率統計缺陷迫使統計由穩殺向博對轉移。
◆ 論壇材料的波動周期特性
論壇材料的波動周期,是在大數據長期跟蹤才會發現的,網上對此有研究的估計不超過5人,靈活運用到統計規律指導就不用說了
波動規律由于要超長時間跟蹤才能得到表格形式的資料,做這個太費時,就不列出來了,個人經驗是25-30期爲一個周期,一個周期裏包括二種波形,一是穩定期,出特穩定在中心次附近,持續時間爲10-15期,這是統計的黃金時期,
二是大幅波動,持續時間在8-12期,這個時期的特瑪是上蹦下跳不規律的,統計者信心打擊最大就是這個時候了。二個不同形態的短周期構成一個完整的周期,周而複始。
周期規律在統計中運用得當,能在平衡時賺到最大利潤,動蕩時警惕投注,或者反利用,大膽追大冷大熱。另一個利用是方法驗證,一個優秀的理論轉化爲統計,一般要經過多期驗證,改進,調整取殺位置等工序,最爲嚴密的驗證是驗40期以上,以1.5-2個周期爲底線,靈活的驗證是在二個周期中各選幾個極端形態來驗證。
認清周期特性後,會對網上大對大錯現象處之泰然,也會對統計的盲目樂觀打上預防針。
2,號碼分布
◆ 號碼集中和分散特性
一個最明顯的現象,就是數據在30行以上直統,幾乎都把上期特殺在盡位,其次是前二三期的特,再其次是前面開得多的單項,如某肖連開二期,第三期的特圍肯定把這個肖的號碼殺得很多。
說明發表的殺碼,都有目標殺的,反映大多數人的喜好,只能說數據直統殺最多的10碼是大家一致討厭的,並不符合規律。
在統計中,大家用得最多便是正殺,把正殺得到號稱最穩殺的15碼和直統後15碼對比,會可笑地發現,同殺至少在10碼以上,這還算統計嗎?不如直接一統把下面的10碼殺掉算了,而且後10碼是平均10錯2左右的,把正殺稱爲最沒有效率的方法也不爲過。而在另一向,大家殺剩的號碼,也趨向集中,在中心一帶,是殺和出的分岐點,目標分散的表現是號碼數量增多,所以論壇收集來的殺碼呈現中間大二頭尖,而同樣數量軟件數據是塊狀。以數據的目光來看,殺向的碼是非理性的,出向的碼是相對分散,而中心一帶則是最符合規律,以出碼爲目標統計時,中心是理想的出特範圍。
前面100圍和震東二個統計表也看得出,震東圍正殺是26錯8,反殺26錯5。100圍正殺30錯7,反殺30錯5。二個不同時期二種不同收集方式,反映出來都是非理性的正殺比相對分散的反殺更穩。反殺少被使用,部分人是錯一次恨一世,印象深刻,正殺錯得更多卻毫無知覺。
爲什麽經常出特的地方會被認爲殺得最穩,最易錯的方法卻被用得最多?究期原因,就是做統計的人沒幾個人願意去看數據直統這個簡單明了的方向標,更沒幾個人去跟蹤直統規律。股市最強調是看大盤,大盤是莊家億萬資金爭奪的焦點,最終也是爲了操控個股的利益。不看大盤炒盤是股盲,另一原因是沒有花時間去了解材料,只憑個人感覺進行統計。這個和出錯圍統計一樣,網上大多數人都認爲上期出錯,今期再錯的機率會更低,基于這個看法,找上期錯材料做組合統計的人一批接一批。可是沒發現有人對上錯圍做過量化研究,上期錯後,今期再錯的機率是多少,是平均百分之幾呢?
我曾經做過專題研究,29期總結是普通圍平均出錯率28.37%,上錯圍平均出錯率是32.94%,29期時間跟蹤,得出二個蒼白的數字,有沒有人留意呢?
◆ 局部偏離
用一版20行的殺碼來說明,假設特爲01,
◆1次 ★01★,03,05,07,08,09,10,21,23,28,40,44,46,49, =14碼.
◆1次 ★01★,02,08,11,12,22,31,32,35,38,41,42,44,45,46,47,48,49, =18碼.
◆1次 ★01★,06,09,12,14,15,16,24,25,26,29,35,37,39,40,48, =16碼.
◆1次 ★01★,03,08,09,12,16,22,24,25,26,27,28,33,35,39,41,44,47,48, =19碼.
◆1次 04,05,06,07,09,16,18,20,27,34,36,40,43,44, =14碼.
◆1次 05,06,10,17,18,20,22,29,30,34,40,41,42,48, =14碼.
◆1次 ★01★,04,11,12,13,19,20,22,27,28,31,40,41,42,49, =15碼.
◆1次 08,10,18,20,22,26,30,32,34,35,36,42,44,46, =14碼.
◆1次 07,10,11,16,19,24,26,30,33,39,40,43,44,49, =14碼.
◆1次 07,10,12,13,18,28,29,30,37,39,40,41,44,49, =14碼.
◆1次 05,06,08,10,11,13,23,26,32,34,35,43,44,46, =14碼.
◆1次 03,06,09,10,15,16,20,21,22,26,27,30,33,34,36,39,40,45,46, =19碼.
◆1次 04,05,14,16,17,24,26,27,30,31,42,44,46,49, =14碼.
◆1次 03,07,08,10,18,20,22,32,37,39,40,42,44,45,46, =15碼.
◆1次 04,09,10,16,20,22,26,27,28,40,42,44,48,49, =14碼.
◆1次 09,10,23,24,29,31,32,34,35,38,42,44,46,49, =14碼.
◆1次 03,06,07,10,12,18,21,22,23,24,32,41,43,46,48,49, =16碼.
◆1次 02,12,14,18,23,24,26,29,31,34,35,36,38,39,42, =15碼.
◆1次 ★01★,08,10,14,24,25,28,35,36,37,38,42,43,44, =14碼.
◆1次 02,10,12,14,20,24,26,30,36,38,40,47,48,49, =14碼.
直接統計是
============<總共301碼次> ★平均{6.14次}=============
◆2次 15,17,19, =3碼'
◆3次 02,13,21,25,33,45,47, =7碼
◆4次 04,11,37, =3碼
◆5次 03,05,14,23,29,31,38,43, =8碼
◆6次 01,06,07,27,28,32,36,41, =8碼---01
◆7次 08,09,16,18,30,34,39,48, =8碼
◆8次 12,20,35, =3碼
◆9次 22,24,46, =3碼
◆10次 26,42,49, =3碼
◆11次 40, =1碼
◆13次 10,44, =2碼.
在直統中是20錯6,出錯率爲30%,很正常的範圍內,分組統計,卻很難避開殺特。
用5行一組殺4-5次的碼,理論是80%錯才會殺錯,這樣設置是遠遠大于平均概率,但在統計中卻常常出現幾個小組錯的,最終結果也錯得一塌胡塗。在開獎後檢查,誰都看得出是因幾個小組出錯影響的,除了驚訝,就不去繼續尋求深層原因。一版數據,把特瑪標出來,會發現分布是由殺特集中,殺特稀疏這樣一塊塊組成,小分組的80%容錯,在局部中是經不起考驗的。這個情況總結爲局部偏離。統計軟件數據的朋友局部偏離感受更深,軟件數據的量很大,全部一統,幾乎沒有超範圍的情況,統計中出錯,最大的原因就是數據局部偏離造成。在小量數據中局部偏離常被忽略,在大量數據中卻上升爲影響統計的最大因素,以命中概率來統計,穩定程度還得靠數據均勻分布爲前提
◆ 連續現象
旋轉統計器的出現,擴展了統計思維,旋轉是連續分組,數據分布中連續出現多少行有特或無特,在旋轉中成了重點。隨著數據量的增大,連續N行殺特或缺失,會由偶然變成必然,從而造成統計失誤,同時也可把這種情況反利用,化成更穩定的統計
如上列20行殺碼中,連續4行殺特和11行空白,二個偏向會把特瑪殺到天上,不對數據進行預分散處理,統計結果根本無法保證。
連續現象是局部偏離的特殊情況,但這個特殊情況的存在卻很普遍,在統計中,考慮了出錯平均或最大範圍,還得考慮局部偏離的比重和極限,才可減少統計理論設計中和漏洞。
在數據分布中,把不殺特的看成對,殺特的看成錯,一版數據就是多個對錯組合的千變萬化的排列,什麽樣的排列最易出特,什麽樣的排列最不可能有特,把這樣的理論,用統計方式表達出來,就是數據排列概率統計,排列能無限擴展思維,是比中率統計更高一級的,也是統計發展的方向。
小結
命中率和分布情況,是數據構成的二個部分
而做統計的朋友,多是看到中率,卻沒留意到特的分布,在統計時考慮不全面,限制了水平的提高。
在統計中,命中概率的方法非常局限,而數據排列卻千變萬化,把排列概率運用到統計中。思維無限馳騁,統計的優點就發揮得淋漓盡致。
希望認眞看了材料特性分析的朋友,能用更全面的角度去了解材料,在統計理論設計時把各個因素都考慮進去,盡量降低無謂的風險,再一個是跳出局限的思維方式,向無限廣闊的境界進軍。
一:統計是一種很平常甚至很差的方法
統計只是一種出碼或殺碼的方法,並沒什麽神奇之處,看碼報看電視看日曆牌數星星猜特都比統計精准得多。網上到處都能看到什麽無錯呀今年錯一之類的厲害高手,想在統計中找個殺10碼10錯一都罕見,見得最多是某某突然研究出個新方法,稱10中9.9不是問題,最後這種高手都是幾期後消失無影無蹤到天堂發財了。除了在櫃底翻出來唬人的記錄,網上這麽多人實際發表,沒幾個統計可以值得使用,統計就算不是垃圾也攀不上高級,和大部分人亂統幾期就自稱數理派滿口概率一副高手自居的身份極不相稱。
二:統計是效率最低的方法
所有方法中,最費時就是統計,要是把材料收集處理統計綜合全包,還有對方法驗證。一期花10多個小時的不在少數。花時間越多,有時是爲了求個心理上的安慰,下注時用的結果不一定是最穩的,卻往往是最費時的。所以說統計是效率最低的取碼方法。
三:中率無用論
幾乎99.98%的人都在用材料命中率估算來進行統計,每個人都有自己一套看起來很過關的理論來支持統計,事實上一千種方法,也只能歸類爲正殺,反殺和正反綜合三種,論壇材料是各個位置都均勻出特的,用固定殺就是在等死,而且綜合越多越是接近數據直統結果,淹沒了分組挑殺的優點。用簡單統計還是複雜綜合一直是困繞著統計者的矛盾。所以說命中概率統計做得越深,結果越差,導致統計者方法不斷變換,在命中率的怪圈裏找方法呀驗算呀,花時間又燒錢還找苦惱。
說完壞話,轉入正題,還得以命中率爲基礎來做統計的,嘿嘿
一:認識特圍材料的特性
材料分析是統計的基礎,不熟悉材料特征,一切統計都是空談,甚至會與統計前的設想相反。
1,出特範圍
◆ 高中率盲區
統計前,幾乎所有的人都要去查找和計算所選材料的中率,並以此爲依據對目標範圍進行統計
而98%的人都會不自覺地把目光停留在記錄特別好的材料上,或者因發表者刪差留好的面子原因,和自身喜好厭差而忽略對差料的分析甚至淡忘,心理上就産生一種論壇材料偏好的印象。這個盲點會導致統計者盲目樂觀和統計方向失誤。
◆ 平均中率計算
平均中率是統計的一個指導系數,但這個簡單的系數卻沒有幾個人去正確理解。
很多人都是去看那些高手的記錄達到多高,憑記錄來做未來中率判斷,這種虛高的中率,會害死自己。
正確而又最簡單計算平均中率是:平均殺碼數/49碼,如35碼圍,中率是35/49=71.4%,平均殺14碼的出錯率是14/49=28.6%.
只要有一定數量的圍(如100個以上)和足夠長的周期(如30-40期),把出錯次數除以總發表次數,得出的結果和用平均碼數/49碼的值,誤差不會超過2%。篇幅有限這兒就不詳細計算了,有對此計算懷疑或興趣的朋友可以隨便找一個特圍區的加星榜計算一下,加星榜是實際發表的記錄,用來計算是最准確的了。計算方法可用TXT文檔替換,如用1替換★,0替換☆,會顯示多少個被替換,再計算一下就行了。平均中率的值,用在單個圍的判斷也是有用的,固定方法計算的圍,長期成績會趨向平均,如一個35碼圍,前面20期錯2成績達90%,在未來很難保持這麽高中率的,正常是出錯增大,下個20期會錯4以上,向35/49=71.4%靠攏而不是遠離,同樣,一個10錯5的圍,下一個10期還錯6,就是奇觀了。把成績好的圍組合同殺的來殺碼,受傷的例子很多的。
◆ 波動範圍和統計目標範圍圈定
數據量足夠大,可以求得平衡,但並不是期期開中心次那麽理想,甚至中心次附近的小範圍所占的比例也不高。特圍數據是動態平衡,跟蹤數據直統會發現,號碼集中在中心次+-10%,而出特更爲集中在中心次+-5%。
綜合分析,會發現出特位置很均勻,各個位置都會開出,且比例相當,只是不同時期小有變化,事實上這是大規律,不論是以網上某個特圍區的局部數據,或是高中率爲標准選擇收集,或是以發表時間早的所謂原創料收集,在時間跨度超過30期後,都顯現均勻分布。
從統計角度來看,目前99%的人都在沿用較爲直觀的命中概率統計,並以正殺爲主。中率統計有明顯的缺陷,一是手段單一,不論多複雜巧妙的理論,在轉化成結果後,都只能歸爲正殺,反殺和正反綜合三大類,二是取殺位置固定,這個拿數據直統和自己統計後的統計表對比就看得出了,基本是同殺某個位置的大多數號碼。說得不好聽就是在等死,一種殺法的理論是每期有1/3機會出錯。也是這個原因,網上想找個10錯1的殺10-15碼非常難,而那些一想出個看似很穩的方法就號稱十中八九的高手,在用心跟蹤幾十期的直統規律,對比自己統計和直統位置,不知有何感想。
不過中率統計被用得最爲廣泛,是有其優勢的,方法直觀易被接受,用的人多,開發得最爲系統,論壇材料統計有個趨勢,由新哥到老貓,發表結果會由殺碼轉換到範圍出碼,原因一是水平提高,能從單一殺碼進步到穩定出碼,二是中率統計缺陷迫使統計由穩殺向博對轉移。
◆ 論壇材料的波動周期特性
論壇材料的波動周期,是在大數據長期跟蹤才會發現的,網上對此有研究的估計不超過5人,靈活運用到統計規律指導就不用說了
波動規律由于要超長時間跟蹤才能得到表格形式的資料,做這個太費時,就不列出來了,個人經驗是25-30期爲一個周期,一個周期裏包括二種波形,一是穩定期,出特穩定在中心次附近,持續時間爲10-15期,這是統計的黃金時期,
二是大幅波動,持續時間在8-12期,這個時期的特瑪是上蹦下跳不規律的,統計者信心打擊最大就是這個時候了。二個不同形態的短周期構成一個完整的周期,周而複始。
周期規律在統計中運用得當,能在平衡時賺到最大利潤,動蕩時警惕投注,或者反利用,大膽追大冷大熱。另一個利用是方法驗證,一個優秀的理論轉化爲統計,一般要經過多期驗證,改進,調整取殺位置等工序,最爲嚴密的驗證是驗40期以上,以1.5-2個周期爲底線,靈活的驗證是在二個周期中各選幾個極端形態來驗證。
認清周期特性後,會對網上大對大錯現象處之泰然,也會對統計的盲目樂觀打上預防針。
2,號碼分布
◆ 號碼集中和分散特性
一個最明顯的現象,就是數據在30行以上直統,幾乎都把上期特殺在盡位,其次是前二三期的特,再其次是前面開得多的單項,如某肖連開二期,第三期的特圍肯定把這個肖的號碼殺得很多。
說明發表的殺碼,都有目標殺的,反映大多數人的喜好,只能說數據直統殺最多的10碼是大家一致討厭的,並不符合規律。
在統計中,大家用得最多便是正殺,把正殺得到號稱最穩殺的15碼和直統後15碼對比,會可笑地發現,同殺至少在10碼以上,這還算統計嗎?不如直接一統把下面的10碼殺掉算了,而且後10碼是平均10錯2左右的,把正殺稱爲最沒有效率的方法也不爲過。而在另一向,大家殺剩的號碼,也趨向集中,在中心一帶,是殺和出的分岐點,目標分散的表現是號碼數量增多,所以論壇收集來的殺碼呈現中間大二頭尖,而同樣數量軟件數據是塊狀。以數據的目光來看,殺向的碼是非理性的,出向的碼是相對分散,而中心一帶則是最符合規律,以出碼爲目標統計時,中心是理想的出特範圍。
前面100圍和震東二個統計表也看得出,震東圍正殺是26錯8,反殺26錯5。100圍正殺30錯7,反殺30錯5。二個不同時期二種不同收集方式,反映出來都是非理性的正殺比相對分散的反殺更穩。反殺少被使用,部分人是錯一次恨一世,印象深刻,正殺錯得更多卻毫無知覺。
爲什麽經常出特的地方會被認爲殺得最穩,最易錯的方法卻被用得最多?究期原因,就是做統計的人沒幾個人願意去看數據直統這個簡單明了的方向標,更沒幾個人去跟蹤直統規律。股市最強調是看大盤,大盤是莊家億萬資金爭奪的焦點,最終也是爲了操控個股的利益。不看大盤炒盤是股盲,另一原因是沒有花時間去了解材料,只憑個人感覺進行統計。這個和出錯圍統計一樣,網上大多數人都認爲上期出錯,今期再錯的機率會更低,基于這個看法,找上期錯材料做組合統計的人一批接一批。可是沒發現有人對上錯圍做過量化研究,上期錯後,今期再錯的機率是多少,是平均百分之幾呢?
我曾經做過專題研究,29期總結是普通圍平均出錯率28.37%,上錯圍平均出錯率是32.94%,29期時間跟蹤,得出二個蒼白的數字,有沒有人留意呢?
◆ 局部偏離
用一版20行的殺碼來說明,假設特爲01,
◆1次 ★01★,03,05,07,08,09,10,21,23,28,40,44,46,49, =14碼.
◆1次 ★01★,02,08,11,12,22,31,32,35,38,41,42,44,45,46,47,48,49, =18碼.
◆1次 ★01★,06,09,12,14,15,16,24,25,26,29,35,37,39,40,48, =16碼.
◆1次 ★01★,03,08,09,12,16,22,24,25,26,27,28,33,35,39,41,44,47,48, =19碼.
◆1次 04,05,06,07,09,16,18,20,27,34,36,40,43,44, =14碼.
◆1次 05,06,10,17,18,20,22,29,30,34,40,41,42,48, =14碼.
◆1次 ★01★,04,11,12,13,19,20,22,27,28,31,40,41,42,49, =15碼.
◆1次 08,10,18,20,22,26,30,32,34,35,36,42,44,46, =14碼.
◆1次 07,10,11,16,19,24,26,30,33,39,40,43,44,49, =14碼.
◆1次 07,10,12,13,18,28,29,30,37,39,40,41,44,49, =14碼.
◆1次 05,06,08,10,11,13,23,26,32,34,35,43,44,46, =14碼.
◆1次 03,06,09,10,15,16,20,21,22,26,27,30,33,34,36,39,40,45,46, =19碼.
◆1次 04,05,14,16,17,24,26,27,30,31,42,44,46,49, =14碼.
◆1次 03,07,08,10,18,20,22,32,37,39,40,42,44,45,46, =15碼.
◆1次 04,09,10,16,20,22,26,27,28,40,42,44,48,49, =14碼.
◆1次 09,10,23,24,29,31,32,34,35,38,42,44,46,49, =14碼.
◆1次 03,06,07,10,12,18,21,22,23,24,32,41,43,46,48,49, =16碼.
◆1次 02,12,14,18,23,24,26,29,31,34,35,36,38,39,42, =15碼.
◆1次 ★01★,08,10,14,24,25,28,35,36,37,38,42,43,44, =14碼.
◆1次 02,10,12,14,20,24,26,30,36,38,40,47,48,49, =14碼.
直接統計是
============<總共301碼次> ★平均{6.14次}=============
◆2次 15,17,19, =3碼'
◆3次 02,13,21,25,33,45,47, =7碼
◆4次 04,11,37, =3碼
◆5次 03,05,14,23,29,31,38,43, =8碼
◆6次 01,06,07,27,28,32,36,41, =8碼---01
◆7次 08,09,16,18,30,34,39,48, =8碼
◆8次 12,20,35, =3碼
◆9次 22,24,46, =3碼
◆10次 26,42,49, =3碼
◆11次 40, =1碼
◆13次 10,44, =2碼.
在直統中是20錯6,出錯率爲30%,很正常的範圍內,分組統計,卻很難避開殺特。
用5行一組殺4-5次的碼,理論是80%錯才會殺錯,這樣設置是遠遠大于平均概率,但在統計中卻常常出現幾個小組錯的,最終結果也錯得一塌胡塗。在開獎後檢查,誰都看得出是因幾個小組出錯影響的,除了驚訝,就不去繼續尋求深層原因。一版數據,把特瑪標出來,會發現分布是由殺特集中,殺特稀疏這樣一塊塊組成,小分組的80%容錯,在局部中是經不起考驗的。這個情況總結爲局部偏離。統計軟件數據的朋友局部偏離感受更深,軟件數據的量很大,全部一統,幾乎沒有超範圍的情況,統計中出錯,最大的原因就是數據局部偏離造成。在小量數據中局部偏離常被忽略,在大量數據中卻上升爲影響統計的最大因素,以命中概率來統計,穩定程度還得靠數據均勻分布爲前提
◆ 連續現象
旋轉統計器的出現,擴展了統計思維,旋轉是連續分組,數據分布中連續出現多少行有特或無特,在旋轉中成了重點。隨著數據量的增大,連續N行殺特或缺失,會由偶然變成必然,從而造成統計失誤,同時也可把這種情況反利用,化成更穩定的統計
如上列20行殺碼中,連續4行殺特和11行空白,二個偏向會把特瑪殺到天上,不對數據進行預分散處理,統計結果根本無法保證。
連續現象是局部偏離的特殊情況,但這個特殊情況的存在卻很普遍,在統計中,考慮了出錯平均或最大範圍,還得考慮局部偏離的比重和極限,才可減少統計理論設計中和漏洞。
在數據分布中,把不殺特的看成對,殺特的看成錯,一版數據就是多個對錯組合的千變萬化的排列,什麽樣的排列最易出特,什麽樣的排列最不可能有特,把這樣的理論,用統計方式表達出來,就是數據排列概率統計,排列能無限擴展思維,是比中率統計更高一級的,也是統計發展的方向。
小結
命中率和分布情況,是數據構成的二個部分
而做統計的朋友,多是看到中率,卻沒留意到特的分布,在統計時考慮不全面,限制了水平的提高。
在統計中,命中概率的方法非常局限,而數據排列卻千變萬化,把排列概率運用到統計中。思維無限馳騁,統計的優點就發揮得淋漓盡致。
希望認眞看了材料特性分析的朋友,能用更全面的角度去了解材料,在統計理論設計時把各個因素都考慮進去,盡量降低無謂的風險,再一個是跳出局限的思維方式,向無限廣闊的境界進軍。