
大數(shù)據(jù)量并發(fā)處理
大并發(fā)大數(shù)據(jù)量請(qǐng)求的處理方法
大并發(fā)大數(shù)據(jù)量請(qǐng)求一般會(huì)分為幾種情況:
1.大量的用戶同時(shí)對(duì)系統(tǒng)的不同功能頁面進(jìn)行查找,更新操作
2.大量的用戶同時(shí)對(duì)系統(tǒng)的同一個(gè)頁面,同一個(gè)表的大數(shù)據(jù)量進(jìn)行查詢操作
3.大量的用戶同時(shí)對(duì)系統(tǒng)的同一個(gè)頁面,同一個(gè)表進(jìn)行更新操作
對(duì)于第一種情況一般處理方法如下:
一。對(duì)服務(wù)器層面的處理
1. 調(diào)整IIS 7應(yīng)用程序池隊(duì)列長度
由原來的默認(rèn)1000改為65535。
IIS Manager > ApplicationPools > Advanced Settings
Queue Length : 65535
2. 調(diào)整IIS 7的appConcurrentRequestLimit設(shè)置
由原來的默認(rèn)5000改為100000。
c:\windows\system32\inetsrv\appcmd.exe set config /section:serverRuntime /appConcurrentRequestLimit:100000
在%systemroot%\System32\inetsrv\config\applicationHost.config中可以查看到該設(shè)置:
[html] view plaincopy
<serverRuntime appConcurrentRequestLimit="100000" />
[html] view plain copy
<serverRuntime appConcurrentRequestLimit="100000" />
3. 調(diào)整machine.config中的processModel>requestQueueLimit的設(shè)置
由原來的默認(rèn)5000改為100000。
[html] view plaincopy
<configuration>
<system.web>
<processModel requestQueueLimit="100000"/>
[html] view plain copy
<configuration>
<system.web>
<processModel requestQueueLimit="100000"/>
4. 修改注冊(cè)表,調(diào)整IIS 7支持的同時(shí)TCPIP連接數(shù)
由原來的默認(rèn)5000改為100000。
reg add HKLM\System\CurrentControlSet\Services\HTTP\Parameteris /v MaxConnections /t REG_DWORD /d 100000
完成上述4個(gè)設(shè)置,就基本可以支持10萬個(gè)同時(shí)請(qǐng)求。如果訪問量達(dá)到10萬以上,就可以考慮將程序和數(shù)據(jù)庫按功能模塊劃分部署到多個(gè)服務(wù)器分擔(dān)訪問壓力。另外可以考慮軟硬件負(fù)載均衡。硬件負(fù)載均衡能夠直接通過智能交換機(jī)實(shí)現(xiàn),處理能力強(qiáng),而且與系統(tǒng)無關(guān),但是價(jià)格貴,配置困難,不能區(qū)分實(shí)習(xí)系統(tǒng)與應(yīng)狀態(tài)。所以硬件負(fù)載均衡適用于一大堆設(shè)備,大訪問量,簡單應(yīng)用。軟件負(fù)載均衡是基于系統(tǒng)與應(yīng)用的,能過更好地根據(jù)系統(tǒng)與應(yīng)用的狀況來分配負(fù)載。性價(jià)比高。PCL負(fù)載均衡軟件,Linux下的LVS軟件。
二。對(duì)數(shù)據(jù)庫層面的處理
當(dāng)兩個(gè)用戶同時(shí)訪問一個(gè)頁面,一個(gè)用戶可能更新的是另一個(gè)用戶已經(jīng)刪除的記錄。或者,在一個(gè)用戶加載頁面跟他點(diǎn)擊刪除按鈕之間的時(shí)間里,另一個(gè)用戶修改了這條記錄的內(nèi)容。所以需要考慮數(shù)據(jù)庫鎖的問題
有下面三中并發(fā)控制策略可供選擇:
什么都不做 –如果并發(fā)用戶修改的是同一條記錄,讓最后提交的結(jié)果生效(默認(rèn)的行為)
開放式并發(fā)(Optimistic Concurrency) - 假定并發(fā)沖突只是偶爾發(fā)生,絕大多數(shù)的時(shí)候并不會(huì)出現(xiàn); 那么,當(dāng)發(fā)生一個(gè)沖突時(shí),僅僅簡單的告知用戶,他所作的更改不能保存,因?yàn)閯e的用戶已經(jīng)修改了同一條記錄
保守式并發(fā)(Pessimistic Concurrency) – 假定并發(fā)沖突經(jīng)常發(fā)生,并且用戶不能容忍被告知自己的修改不能保存是由于別人的并發(fā)行為;那么,當(dāng)一個(gè)用戶開始編輯一條記錄,鎖定該記錄,從而防止其他用戶編輯或刪除該記錄,直到他完成并提交自己的更改
當(dāng)多個(gè)用戶試圖同時(shí)修改數(shù)據(jù)時(shí),需要建立控制機(jī)制來防止一個(gè)用戶的修改對(duì)同時(shí)操作的其他用戶所作的修改產(chǎn)生不利的影響。處理這種情況的系統(tǒng)叫做“并發(fā)控制”。
并發(fā)控制的類型
通常,管理數(shù)據(jù)庫中的并發(fā)有三種常見的方法:
保守式并發(fā)控制 - 在從獲取記錄直到記錄在數(shù)據(jù)庫中更新的這段時(shí)間內(nèi),該行對(duì)用戶不可用。
開放式并發(fā)控制 - 只有當(dāng)實(shí)際更新數(shù)據(jù)時(shí),該行才對(duì)其他用戶不可用。更新將在數(shù)據(jù)庫中檢查該行并確定是否進(jìn)行了任何更改。如果試圖更新已更改的記錄,則將導(dǎo)致并發(fā)沖突。
最后的更新生效 - 只有當(dāng)實(shí)際更新數(shù)據(jù)時(shí),該行才對(duì)其他用戶不可用。但是,不會(huì)將更新與初始記錄進(jìn)行比較;而只是寫出記錄,這可能就改寫了自上次刷新記錄后其他用戶所進(jìn)行的更改。
保守式并發(fā)
保守式并發(fā)通常用于兩個(gè)目的。第一,在某些情況下,存在對(duì)相同記錄的大量爭用。在數(shù)據(jù)上放置鎖所費(fèi)的成本小于發(fā)生并發(fā)沖突時(shí)回滾更改所費(fèi)的成本。
在事務(wù)過程中不宜更改記錄的情況下,保守式并發(fā)也非常有用。庫存應(yīng)用程序便是一個(gè)很好的示例。假定有一個(gè)公司代表正在為一名潛在的客戶檢查庫存。您通常要鎖定記錄,直到生成訂單為止,這通常會(huì)將該項(xiàng)標(biāo)記為“已訂購”狀態(tài)并將其從可用庫存中移除。如果未生成訂單,則將釋放該鎖,以便其他檢查庫存的用戶得到準(zhǔn)確的可用庫存計(jì)數(shù)。
但是,在斷開的結(jié)構(gòu)中無法進(jìn)行保守式并發(fā)控制。連接打開的時(shí)間只夠讀取數(shù)據(jù)或更新數(shù)據(jù),因此不能長時(shí)間地保持鎖。此外,長時(shí)間保留鎖的應(yīng)用程序?qū)o法進(jìn)行伸縮。
開放式并發(fā)
在開放式并發(fā)中,只有在訪問數(shù)據(jù)庫時(shí)才設(shè)置并保持鎖。這些鎖將防止其他用戶在同一時(shí)間更新記錄。除了進(jìn)行更新這一確切的時(shí)刻之外,數(shù)據(jù)始終可用。有關(guān)更多信息,請(qǐng)參見開放式并發(fā)。
當(dāng)試圖更新時(shí),已更改行的初始版本將與數(shù)據(jù)庫中的現(xiàn)有行進(jìn)行比較。如果兩者不同,更新將失敗,并引發(fā)并發(fā)錯(cuò)誤。這時(shí),將由您使用所創(chuàng)建的業(yè)務(wù)邏輯來協(xié)調(diào)這兩行。
最后的更新生效
當(dāng)使用“最后的更新生效”時(shí),不會(huì)對(duì)初始數(shù)據(jù)進(jìn)行檢查,而只是將更新寫入數(shù)據(jù)庫。很明顯,可能會(huì)發(fā)生以下情況:
用戶 A 從數(shù)據(jù)庫獲取一項(xiàng)記錄。
用戶 B 從數(shù)據(jù)庫獲取相同的記錄,對(duì)其進(jìn)行修改,然后將更新后的記錄寫回?cái)?shù)據(jù)庫。
用戶 A 修改“舊”記錄并將其寫回?cái)?shù)據(jù)庫。
在上述情況中,用戶 A 永遠(yuǎn)也不會(huì)看到用戶 B 作出的更改。如果您計(jì)劃使用并發(fā)控制的“最后的更新生效”方法,則要確保這種情況是可以接受的。
ADO.NET 和 Visual Studio .NET 中的并發(fā)控制
因?yàn)閿?shù)據(jù)結(jié)構(gòu)基于斷開的數(shù)據(jù),所以 ADO.NET 和 Visual Studio .NET 使用開放式并發(fā)。因此,您需要添加業(yè)務(wù)邏輯,以利用開放式并發(fā)解決問題。
如果您選擇使用開放式并發(fā),則可以通過兩種常規(guī)的方法來確定是否已發(fā)生更改:版本方法(實(shí)際版本號(hào)或日期時(shí)間戳)和保存所有值方法。
版本號(hào)方法
在版本號(hào)方法中,要更新的記錄必須具有一個(gè)包含日期時(shí)間戳或版本號(hào)的列。當(dāng)讀取該記錄時(shí),日期時(shí)間戳或版本號(hào)將保存在客戶端。然后,將對(duì)該值進(jìn)行部分更新。
處理并發(fā)的一種方法是僅當(dāng) WHERE 子句中的值與記錄上的值匹配時(shí)才進(jìn)行更新。該方法的 SQL 表示形式為:
UPDATE Table1 SET Column1 = @newvalue1, Column2 = @newvalue2
WHERE DateTimeStamp = @origDateTimeStamp
或者,可以使用版本號(hào)進(jìn)行比較:
UPDATE Table1 SET Column1 = @newvalue1, Column2 = @newvalue2
WHERE RowVersion = @origRowVersionValue
如果日期時(shí)間戳或版本號(hào)匹配,則表明數(shù)據(jù)存儲(chǔ)區(qū)中的記錄未被更改,并且可以安全地使用數(shù)據(jù)集中的新值對(duì)該記錄進(jìn)行更新。如果不匹配,則將返回錯(cuò)誤。您可以編寫代碼,在 Visual Studio .NET 中實(shí)現(xiàn)這種形式的并發(fā)檢查。您還必須編寫代碼來響應(yīng)任何更新沖突。為了確保日期時(shí)間戳或版本號(hào)的準(zhǔn)確性,您需要在表上設(shè)置觸發(fā)器,以便在發(fā)生對(duì)行的更改時(shí),對(duì)日期時(shí)間戳或版本號(hào)進(jìn)行更新。
保存所有值方法
使用日期時(shí)間戳或版本號(hào)的替代方法是在讀取記錄時(shí)獲取所有字段的副本。ADO.NET 中的 DataSet 對(duì)象維護(hù)每個(gè)修改記錄的兩個(gè)版本:初始版本(最初從數(shù)據(jù)源中讀取的版本)和修改版本(表示用戶更新)。當(dāng)試圖將記錄寫回?cái)?shù)據(jù)源時(shí),數(shù)據(jù)行中的初始值將與數(shù)據(jù)源中的記錄進(jìn)行比較。如果它們匹配,則表明數(shù)據(jù)庫記錄在被讀取后尚未經(jīng)過更改。在這種情況下,數(shù)據(jù)集中已更改的值將成功地寫入數(shù)據(jù)庫。
對(duì)于數(shù)據(jù)適配器的四個(gè)命令(DELETE、INSERT、SELECT 和 UPDATE)來說,每個(gè)命令都有一個(gè)參數(shù)集合。每個(gè)命令都有用于初始值和當(dāng)前值(或修改值)的參數(shù)。
對(duì)于第二種情況的處理:
因?yàn)槭谴蟛l(fā)請(qǐng)求,也能采用第一種情況的處理方法,另外因?yàn)槭菍?duì)大數(shù)據(jù)量進(jìn)行檢索,所以需要考慮查詢效率的問題
1.對(duì)表按查詢條件建立索引
2.對(duì)查詢語句進(jìn)行優(yōu)化
3.可以考慮對(duì)查詢數(shù)據(jù)使用緩存
對(duì)于第三種情況的處理:
也能采用第一種情況的處理方法,另外因?yàn)槭菍?duì)同一個(gè)表進(jìn)行更新操作,可以考慮使用下面的處理方法:
1.先將數(shù)據(jù)保存到緩存中,當(dāng)數(shù)據(jù)達(dá)到一定的數(shù)量后,再更新到數(shù)據(jù)庫中
2.將表按索引劃分(分表,分區(qū)),如:對(duì)于一個(gè)存儲(chǔ)全國人民信息的表,這個(gè)數(shù)據(jù)量是很大的,如果按省劃分為多個(gè)表,在將全國的人民信息按省存儲(chǔ)到相應(yīng)的表中,然后根據(jù)省份對(duì)相應(yīng)的并進(jìn)行查詢和更新,這樣大并發(fā)和大數(shù)據(jù)量的問題就會(huì)減小很多
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03