轉(zhuǎn)載自PMCAFF,侵權(quán)請(qǐng)聯(lián)系本人刪除,只為分享出來(lái)大家一起學(xué)習(xí)。
附原文地址:http://www.pmcaff.com/article/index/287054019721344?from=search
最近在排查用戶收不到我們下發(fā)的短信的情況,排查下來(lái)應(yīng)該是運(yùn)營(yíng)商黑名單的問題,想起之前看到的一篇文章,作者分析的很透徹,分享出來(lái)給大家看下。
一、第三方短信服務(wù)商存在的意義
企業(yè)使用短信服務(wù),本質(zhì)上只是要解決一個(gè)給終端用戶下發(fā)短信的簡(jiǎn)單需求。之所以有那么多短信服務(wù)商的存在,是因?yàn)橹袊?guó)的國(guó)情,三大運(yùn)營(yíng)商互不相同,各個(gè)省公司又是獨(dú)立的,如果作為一個(gè)企業(yè),你想直接跟運(yùn)營(yíng)商合作,那抱歉,你需要接移動(dòng)、聯(lián)通、電信三家運(yùn)營(yíng)商,否則部分跨網(wǎng)用戶服務(wù)無(wú)法得到很好的保障。而為了保證服務(wù)穩(wěn)定,有互備,你需要每個(gè)運(yùn)營(yíng)商需要接2個(gè)以上的省公司的通道,以免運(yùn)營(yíng)商故障導(dǎo)致服務(wù)中斷。使用運(yùn)營(yíng)商的服務(wù),你作為用戶,尤其是普通企業(yè),你不會(huì)有被服務(wù)的感覺,只能遵照運(yùn)營(yíng)商的規(guī)則來(lái)使用,并按時(shí)繳納保底套餐,而且價(jià)格很高昂。
在這樣的環(huán)境下,第三方服務(wù)商出現(xiàn)了,他們跟運(yùn)營(yíng)商比有幾大優(yōu)勢(shì):1、接入一家直接三網(wǎng)通。2、沒有坑爹的保底套餐,起碼沒有運(yùn)營(yíng)商的坑。3、你是甲方,能享受一定的服務(wù)。
二、到達(dá)率
1、? 提交成功率
企業(yè)通過服務(wù)商提供的API或SDK,向服務(wù)商提交短信的發(fā)送請(qǐng)求,這時(shí)會(huì)產(chǎn)生一個(gè)提交成功率。提交成功率的高低主要取決于網(wǎng)絡(luò)環(huán)境。通常來(lái)說,提交成功率是很高的,99.9%以上。在很多第三方服務(wù)商的宣傳中會(huì)提到成功率98%,99%,甚至更高,說的其實(shí)都是提交成功率。
2、? 狀態(tài)報(bào)告成功率
當(dāng)下發(fā)的地方網(wǎng)關(guān)對(duì)手機(jī)發(fā)送短信后,手機(jī)會(huì)有一個(gè)狀態(tài)報(bào)告返回,告訴網(wǎng)關(guān)短信接收狀態(tài)。這個(gè)就是狀態(tài)報(bào)告,是真正手機(jī)接收的成功率。在排除手機(jī)異常以及運(yùn)營(yíng)商網(wǎng)關(guān)異常的情況下,這個(gè)成功率也是超過99.9%的,就像你平時(shí)手機(jī)點(diǎn)對(duì)點(diǎn)發(fā)送短信的成功率是一樣的,運(yùn)營(yíng)商的基礎(chǔ)服務(wù)能力還是值得肯定的。
狀態(tài)報(bào)告的成功率,主要取決于企業(yè)自己用戶手機(jī)號(hào)的準(zhǔn)確度。空號(hào)越多,成功率越低。而絕大多數(shù)的第三方服務(wù)商,在給絕大多數(shù)客戶提供服務(wù)時(shí),不會(huì)提供狀態(tài)報(bào)告。或是提供虛假的狀態(tài)報(bào)告。另外有個(gè)小知識(shí),運(yùn)營(yíng)商的狀態(tài)報(bào)告是72小時(shí)內(nèi)返還的。當(dāng)手機(jī)通訊正常時(shí),接收后會(huì)及時(shí)的返回。但是如果手機(jī)出于異常狀態(tài),狀態(tài)報(bào)告是等待返回。等待返回的報(bào)告在72小時(shí)內(nèi)陸續(xù)返回,如果72小時(shí)還沒結(jié)果,運(yùn)營(yíng)商會(huì)給出一個(gè)結(jié)果。比如你給關(guān)機(jī)的手機(jī)下發(fā)一條短信,在72小時(shí)內(nèi)只要不開機(jī),就是等待返回狀態(tài),開機(jī)以后,如果送達(dá),就會(huì)顯示成功。所以統(tǒng)計(jì)過短時(shí)間內(nèi)的狀態(tài)報(bào)告成功率,并不是很有意義。
3、? 黑名單
提交的短信如果在服務(wù)商或運(yùn)營(yíng)商的黑名單里,那這條短信必然是不會(huì)發(fā)送的。手機(jī)用戶如果打運(yùn)營(yíng)商的投訴電話投訴過短信業(yè)務(wù),那不管你是否想收其他企業(yè)的短信,運(yùn)營(yíng)商都會(huì)把你加到黑名單里,并建議第三方服務(wù)商也對(duì)你的手機(jī)號(hào)過濾,以免造成更多的投訴。投訴是運(yùn)營(yíng)商的一個(gè)重要考核指標(biāo),運(yùn)營(yíng)商也會(huì)把這個(gè)指標(biāo)轉(zhuǎn)嫁給第三方服務(wù)商,每個(gè)服務(wù)商都背負(fù)著很高的投訴壓力,所以他們會(huì)想盡辦法減少用戶投訴。常見的手段就是把“容易投訴的人”加到黑名單里,不對(duì)其發(fā)送短信。除了前面提到的打過運(yùn)營(yíng)商投訴電話的人以外,還有回復(fù)TD的人,也會(huì)被很多服務(wù)商添加到黑名單里。一些老牌服務(wù)商做的很簡(jiǎn)單粗暴,一個(gè)手機(jī)回復(fù)了TD,就會(huì)進(jìn)他們平臺(tái)的黑名單,因?yàn)檫@個(gè)人是“易投訴人群”,他們平臺(tái)上的所有用戶發(fā)送時(shí)都會(huì)屏蔽這個(gè)手機(jī)。黑名單庫(kù)的大小會(huì)直接決定你短信的到達(dá)率。有些服務(wù)商的黑名單庫(kù)有幾千萬(wàn)的手機(jī)號(hào)。傳統(tǒng)公司做的久,黑名單庫(kù)也會(huì)越大。通常他們不太會(huì)去對(duì)黑名單“瘦身”,因?yàn)楹诿麊我环矫婵梢詼p少投訴,另一方面黑名單失敗的部分產(chǎn)生的費(fèi)用,對(duì)于這些公司來(lái)說是純利潤(rùn)。簡(jiǎn)直找不到“瘦身”的理由。我們做過統(tǒng)計(jì),有些傳統(tǒng)公司的黑名單庫(kù)直接會(huì)導(dǎo)致近5%的到達(dá)率差異。
4、? 頻率限制
在使用一些服務(wù)商的過程中,企業(yè)會(huì)碰到一些頻率限制,規(guī)則各有不同。這些頻率限制的初衷是避免騷擾用戶,降低投訴。而頻率限制會(huì)對(duì)一些業(yè)務(wù)場(chǎng)景產(chǎn)生影響,比如監(jiān)控告警短信。頻率限制也會(huì)對(duì)到達(dá)率產(chǎn)生些許影響,但是通常來(lái)說,比重相對(duì)較小。
5、? 扣量
在2013年以前,整個(gè)行業(yè)主要以垃圾短信為主的時(shí)候,扣量很常見,在那個(gè)時(shí)候,很少有用戶知道“狀態(tài)報(bào)告”這東西。而2013年后隨著行業(yè)逐步向系統(tǒng)短信發(fā)展,扣量的行為很少見了。要鑒定服務(wù)商是否有扣量,可以做“抽查”。不定時(shí)不定期,取一些手機(jī)號(hào),混在業(yè)務(wù)短信或單獨(dú)測(cè)試都行。注意,這些手機(jī)號(hào)里,請(qǐng)隨機(jī)放兩個(gè)空號(hào)或者停機(jī)或者關(guān)機(jī)的號(hào)碼,看一下你的服務(wù)商給你的狀態(tài)報(bào)告是否與實(shí)際相符。
對(duì)于到達(dá)率,請(qǐng)服務(wù)商提供狀態(tài)報(bào)告,統(tǒng)計(jì)狀態(tài)報(bào)告成功率。統(tǒng)計(jì)黑名單的失敗率,如果發(fā)現(xiàn)黑名單失敗率高,可以跟服務(wù)商溝通取消黑名單,如果無(wú)法協(xié)商,建議換服務(wù)商。不定期的做一下測(cè)試,看看服務(wù)商的狀態(tài)報(bào)告是否真實(shí)。
二、發(fā)送速度
這里說的發(fā)送速度,指的是從企業(yè)發(fā)起提交請(qǐng)求,到用戶手機(jī)接收的這個(gè)耗時(shí)。當(dāng)然,在提交請(qǐng)求前,企業(yè)內(nèi)部的業(yè)務(wù)處理邏輯也會(huì)產(chǎn)生些許耗時(shí),也要算在整體時(shí)間里面,但這部分時(shí)間與服務(wù)商無(wú)關(guān)。
1、? 通道速度
每條短信網(wǎng)關(guān),在落地運(yùn)營(yíng)商的系統(tǒng)里,都會(huì)被配置一個(gè)發(fā)送速度,不同的運(yùn)營(yíng)商、不同的省公司,分配的規(guī)則是不同的。比如你在上海移動(dòng)申請(qǐng)一條10657的端口,或者服務(wù)商的10690落地在上海移動(dòng),上海移動(dòng)就是落地運(yùn)營(yíng)商,他會(huì)給這個(gè)通道配置一個(gè)速度。這個(gè)速度從每秒1條到每秒幾百不等。
當(dāng)然,這個(gè)速度,通常不是給你一家的。除非你是月發(fā)送量百萬(wàn)級(jí)的用戶,否則你很難拿到獨(dú)享的通道速度。大客戶有些會(huì)有“專用通道”,享受獨(dú)享的速度。當(dāng)然這個(gè)專用,打了引號(hào),因?yàn)榇蠖鄶?shù)客戶其實(shí)分辨不出是否真的是“專用”。
2、優(yōu)先級(jí)
但是,不是獨(dú)享,未必就不能“秒到”。在服務(wù)商的處理中,有一個(gè)優(yōu)先級(jí)處理。當(dāng)不同的服務(wù)商優(yōu)先級(jí)規(guī)則也不一樣。有些服務(wù)商根據(jù)你的發(fā)送量來(lái)定義你的優(yōu)先級(jí),有些服務(wù)商根據(jù)你短信的業(yè)務(wù)類型來(lái)分優(yōu)先級(jí),甚至在一些公司,你所對(duì)接的接口銷售給不給力,也會(huì)影響到你的“優(yōu)先級(jí)”。
3、? 服務(wù)商平臺(tái)處理耗時(shí)
當(dāng)短信提交到服務(wù)商的平臺(tái)后,會(huì)經(jīng)過各種邏輯處理,會(huì)產(chǎn)生一個(gè)耗時(shí)。一般服務(wù)商的這個(gè)耗時(shí)在幾毫秒到幾十毫秒,可以忽略。當(dāng)然也有差的。
還有一個(gè)人為處理的耗時(shí)。尤其企業(yè)發(fā)送批量群發(fā)短信的時(shí)候,比較明顯。短信提交后不是立刻下發(fā)的,為了避免用戶發(fā)送違法違規(guī)的內(nèi)容,第三方服務(wù)商會(huì)有一個(gè)人工的審核,這個(gè)審核的耗時(shí)取決于服務(wù)商的審核人員的效率,當(dāng)前整個(gè)平臺(tái)上用戶的提交的待審核短信量等等。所以往往,在節(jié)假日,大促時(shí),人工審核會(huì)很大的影響你的短信發(fā)送,甚至?xí)新彙⒄`審導(dǎo)致你的短信沒發(fā)出去的。
也許你會(huì)碰到一些服務(wù)商,使用短信模板,要求你先提交模板,審核通過后再發(fā)。可能你會(huì)覺得不方便,但是,這卻是對(duì)你相對(duì)可控的策略。因?yàn)樘崆皩徍送ㄟ^的模板,在你實(shí)際發(fā)送的時(shí)候就沒有人工審核了,可以及時(shí)的發(fā)送。一個(gè)是先發(fā)后審,一個(gè)是先審后發(fā),從可控的角度,先審更好,如果提前知道內(nèi)容有問題,還可以做修改直到通過為止,如果活動(dòng)開始以后才知道內(nèi)容過不了,這鍋服務(wù)商是不會(huì)幫你背的……
4、? 落地網(wǎng)關(guān)→下發(fā)網(wǎng)關(guān)→手機(jī)的耗時(shí)
經(jīng)常看到服務(wù)商說“短信5秒內(nèi)必到”,甚至承諾更短的時(shí)間,很抱歉,那些都是不真實(shí)的。
當(dāng)你的落地網(wǎng)關(guān)和下發(fā)網(wǎng)關(guān)是一個(gè)地方的時(shí)候,速度會(huì)比不同的時(shí)候更快。通道落地在上海移動(dòng),給上海移動(dòng)手機(jī)發(fā),會(huì)比給北京移動(dòng)的手機(jī)發(fā)送更快,這個(gè)耗時(shí),不太好統(tǒng)計(jì)。
2G/3G/4G等網(wǎng)絡(luò)環(huán)境,也會(huì)影響耗時(shí)。影響幅度不確定。
手機(jī)所處的信號(hào)狀態(tài),也會(huì)影響短信的接受速度。信號(hào)不穩(wěn)定或不好的地方,接收會(huì)慢。
我們落地在上海移動(dòng)的通道給我上海移動(dòng)的手機(jī)(iphone,4G)發(fā)送短信時(shí),基本是點(diǎn)下去就收到了的,可是同一個(gè)通道給我們不同的監(jiān)控機(jī)發(fā)送的統(tǒng)計(jì)來(lái)看,在2-6秒不等。
根據(jù)我們的監(jiān)控統(tǒng)計(jì)三網(wǎng)所有用戶的數(shù)據(jù)顯示,客戶在實(shí)際發(fā)送時(shí),大約70%的短信,會(huì)在5秒內(nèi)到達(dá),25%左右在5-10秒內(nèi),也就是說,在實(shí)際場(chǎng)景下,大約95%的短信,會(huì)在10秒內(nèi)到達(dá)用戶手機(jī)。這是客觀真實(shí)的情況。
小結(jié):總的來(lái)說,發(fā)送速度是很能體現(xiàn)供應(yīng)商的技術(shù)實(shí)力及資源實(shí)力的。在這方面,通常來(lái)說,大公司相對(duì)小公司強(qiáng)。偶有例外。不要輕信銷售的口頭承諾和接入測(cè)試期的情況,多在實(shí)際運(yùn)營(yíng)過程中去檢驗(yàn)。
三、穩(wěn)定性
容易被忽視的一個(gè)指標(biāo)。無(wú)論你選擇直接跟運(yùn)營(yíng)商合作,還是和第三方服務(wù)商合作,都會(huì)面臨這個(gè)問題。應(yīng)該有很多用戶碰到過這種情況:短信掛了,發(fā)現(xiàn)了去找服務(wù)商,過了段時(shí)間好了,然后對(duì)于之前掛的問題,服務(wù)商會(huì)給出“機(jī)房斷電了”,“運(yùn)營(yíng)商故障”等等解釋。而這時(shí)候,你的損失已經(jīng)無(wú)法挽回。影響到服務(wù)穩(wěn)定性的因素很多,常見的有網(wǎng)絡(luò)環(huán)境、服務(wù)器超載、運(yùn)營(yíng)商割接導(dǎo)致的終端、運(yùn)營(yíng)商故障等等。這些問題不可避免,但是優(yōu)質(zhì)的服務(wù)商可以通過嚴(yán)密的監(jiān)控和切換邏輯,將這些故障的影響降到最低。
以通道故障為例,如果是落地網(wǎng)關(guān)的故障,有些公司在沒有監(jiān)控或只是通過狀態(tài)報(bào)告成功率來(lái)監(jiān)控的情況下,發(fā)現(xiàn)問題的時(shí)候已經(jīng)滯后半小時(shí)甚至更久。而在沒有自動(dòng)切換的情況下,尤其是節(jié)假日和半夜,沒有人及時(shí)的來(lái)處理,這種服務(wù)中斷可能是半小時(shí)一小時(shí),可能是幾小時(shí)更久。對(duì)于這個(gè)問題,云片的有自己的監(jiān)控和自動(dòng)切換平臺(tái)。我們對(duì)所有的通道每分鐘一次做監(jiān)控,發(fā)現(xiàn)異常后系統(tǒng)自動(dòng)切換通道,從問題的發(fā)現(xiàn)到切換在一分鐘內(nèi)完成。這意味著如果你的用戶使用的驗(yàn)證碼短信因?yàn)橥ǖ拦收系谝粭l沒有正常送達(dá)用戶的話,當(dāng)這個(gè)用戶在1分鐘后再次嘗試獲取驗(yàn)證碼時(shí),短信的通道故障已經(jīng)被排除。
小結(jié):理論上,如果你或者你的服務(wù)商,通過網(wǎng)絡(luò)的監(jiān)控、API請(qǐng)求的監(jiān)控、服務(wù)器負(fù)載的監(jiān)控、通道實(shí)際發(fā)送監(jiān)控以及狀態(tài)報(bào)告統(tǒng)計(jì)監(jiān)控等各個(gè)維度的監(jiān)控及處理機(jī)制,能夠有效的提高服務(wù)的穩(wěn)定性。這些監(jiān)控,通常企業(yè)不會(huì)投入太多的時(shí)間和精力自己做,或者做了但是做得并不專業(yè),運(yùn)營(yíng)商也無(wú)法給用戶提供這類服務(wù),所以選擇一個(gè)靠譜的第三方服務(wù)商是最好的解決辦法。
四、價(jià)格
(略)
原文作者所服務(wù)的公司:云片,www.yunpian.com