主頁 > 知識庫 > 大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫選擇:SQL還是NoSQL?

大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫選擇:SQL還是NoSQL?

熱門標(biāo)簽:長沙外呼系統(tǒng)平臺 城市地圖標(biāo)志怎么標(biāo)注 硅基電話機(jī)器人官網(wǎng) 美國地圖標(biāo)注軟件下載 怎么修改高德地圖標(biāo)注 合肥crm外呼系統(tǒng)加盟 西安電話自動外呼系統(tǒng) 漯河電銷回?fù)芡夂粝到y(tǒng) 電話機(jī)器人怎么看余額

一、專家簡介
VoltDB公司首席技術(shù)官Ryan Betts表示,SQL已經(jīng)贏得了大型企業(yè)的廣泛部署,大數(shù)據(jù)是它可以支持的另一個(gè)領(lǐng)域。
Couchbase公司首席執(zhí)行官Bob Wiederhold表示,NoSQL是可行的選擇,并且從很多方面來看,它是大數(shù)據(jù)的最佳選擇,特別是涉及到可擴(kuò)展性時(shí)。
二、SQL經(jīng)歷時(shí)間的考驗(yàn),并仍然在蓬勃發(fā)展
結(jié)構(gòu)化查詢語言(SQL)是經(jīng)過時(shí)間考驗(yàn)的勝利者,它已經(jīng)主宰了幾十年,目前大數(shù)據(jù)公司和組織(例如谷歌、Facebook、Cloudera和Apache)正在積極投資于SQL。
在成為主導(dǎo)技術(shù)(例如SQL)后,有時(shí)候我們很容易忘記其優(yōu)越性。SQL的獨(dú)特優(yōu)勢包括:
1. SQL能夠加強(qiáng)與數(shù)據(jù)的交互,并允許對單個(gè)數(shù)據(jù)庫設(shè)計(jì)提出問題。這是很關(guān)鍵的特征,因?yàn)闊o法交互的數(shù)據(jù)基本上是沒用的,并且,增強(qiáng)的交互性能夠帶來新的見解、新的問題和更有意義的未來交互。
2. SQL是標(biāo)準(zhǔn)化的,使用戶能夠跨系統(tǒng)運(yùn)用他們的知識,并對第三方附件和工具提供支持。
3. SQL能夠擴(kuò)展,并且是多功能和經(jīng)過時(shí)間驗(yàn)證的,這能夠解決從快寫為主導(dǎo)的傳輸?shù)綊呙杳芗蜕钊敕治龅葐栴}。
4. SQL對數(shù)據(jù)呈現(xiàn)和存儲采用正交形式,一些SQL系統(tǒng)支持JSON和其他結(jié)構(gòu)化對象格式,比NoSQL具有更好的性能和更多功能。
雖然NoSQL的出現(xiàn)帶來了一些影響,但SQL仍然主導(dǎo)著市場,并在大數(shù)據(jù)領(lǐng)域贏得了很多投資和廣泛部署。
NoSQL的說法很含糊,對于本次討論,我借用Rick Cattell對NoSQL的定義,即提供簡單操作(例如密鑰/數(shù)值存儲)或簡單記錄和索引,并專注于這些簡單操作的橫向可擴(kuò)展性的系統(tǒng)。
很顯然,現(xiàn)在很多新的數(shù)據(jù)庫并不是都一樣,認(rèn)識每種數(shù)據(jù)庫背后的原理以及潛在問題是成功的關(guān)鍵。NoSQL的主要特點(diǎn)使其更適合于特定的問題。例如,圖形數(shù)據(jù)庫更適合于數(shù)據(jù)通過關(guān)系組織的情況,而專門的文本搜索系統(tǒng)更適合于需要實(shí)時(shí)搜索的情況。
在這里,讓我們看看SQL系統(tǒng)的主要優(yōu)勢和差異化功能:
* SQL可實(shí)現(xiàn)交互性。 SQL是一種聲明性查詢語言。用戶說出他們想要什么(例如,顯示過去五年三月份期間頂級客戶的地理位置),數(shù)據(jù)庫內(nèi)部就會構(gòu)件算法并提取請求的結(jié)果。相比之下,NoSQL編程創(chuàng)新MapReduce是一種程序性查詢技術(shù)。在用戶提出請求時(shí),MapReduce要求用戶不僅說出自己想要什么,而且要求他們陳述如何產(chǎn)生答案。
這聽起來像一個(gè)無趣的技術(shù)差異,但這很關(guān)鍵,原因在于:首先,聲明性SQL查詢更容易通過圖形化工具以及點(diǎn)擊報(bào)告構(gòu)建器來構(gòu)建。這讓分析師、操作員、管理者和其他不具備軟件編程能力的員工進(jìn)行數(shù)據(jù)庫查詢;其次,數(shù)據(jù)庫引擎可以利用內(nèi)部信息來選擇最有效的算法。改變數(shù)據(jù)庫的物理布局或數(shù)據(jù)庫,最佳算法仍然能夠計(jì)算出來。而在程序性系統(tǒng)中,編程人員需要重新訪問和重新編程算法,這是非常昂貴且容易出錯的過程。
市場理解這個(gè)關(guān)鍵區(qū)別。在2010年,谷歌宣布部署SQL來補(bǔ)充MapReduce,主要受內(nèi)部用戶需求所驅(qū)動。最近,F(xiàn)acebook發(fā)布了Presto(一種SQL部署)來查詢其PB級HDFS集群。根據(jù)Facebook表示:“隨著我們的倉庫增長到PB級,以及我們的需求變化,我們清楚地意識到,我們需要一個(gè)提供低延時(shí)查詢的互動系統(tǒng)?!贝送猓珻loudera也正在構(gòu)建Impala—另一個(gè)基于HDFS的SQL部署。
* SQL是標(biāo)準(zhǔn)化的。 雖然供應(yīng)商有時(shí)候會添加自己的語言到SQL界面,但SQL的核心是標(biāo)準(zhǔn)化的,還有其他規(guī)格(例如ODBC和JDBC)提供廣泛可用的穩(wěn)定界面到SQL存儲。這帶來了一個(gè)管理和操作工具生態(tài)系統(tǒng),可以在SQL系統(tǒng)之上設(shè)計(jì)、監(jiān)控、檢查、探索和構(gòu)建應(yīng)用程序。
SQL用戶和程序員可用跨多個(gè)后端系統(tǒng)重復(fù)使用其API和UI知識,減少了應(yīng)用程序的開發(fā)時(shí)間。標(biāo)準(zhǔn)化還允許聲明性第三方提取、轉(zhuǎn)換、加載(ETL)工具,使企業(yè)可以在數(shù)據(jù)庫之間以及跨系統(tǒng)傳輸數(shù)據(jù)。
* SQL可擴(kuò)展。 認(rèn)為SQL必須犧牲以獲得可擴(kuò)展性的看法,完全是錯誤的。如前所述,F(xiàn)acebook創(chuàng)建了一個(gè)SQL界面來查詢PB級數(shù)據(jù)。SQL能夠非常有效地運(yùn)行極快的ACID傳輸。SQL對數(shù)據(jù)存儲和索引提供的抽象[注]化允許跨各種問題和數(shù)據(jù)集大小的一致使用,讓SQL可以跨集群復(fù)制數(shù)據(jù)存儲有效地運(yùn)行。使用SQL作為界面獨(dú)立于構(gòu)建云、規(guī)?;騂A系統(tǒng),SQL中并沒有什么在阻止和限制容錯、高可用性和復(fù)制。事實(shí)上,所有現(xiàn)代SQL系統(tǒng)支持云友好型橫向可擴(kuò)展性、復(fù)制和容錯性。
* SQL支持JSON。 幾年前,很多SQL系統(tǒng)增加了XML文檔支持?,F(xiàn)在,隨著JSON成為一種流行的數(shù)據(jù)交換格式,SQL供應(yīng)商也紛紛加入了JSON型的支持。基于現(xiàn)在靈活的編程過程和web基礎(chǔ)設(shè)施的正常運(yùn)行時(shí)間要求,我們很需要結(jié)構(gòu)化數(shù)據(jù)類型的支持。Oracle 12c、PostgreSQL 9.2、VoltDB和其他支持JSON的數(shù)據(jù)庫,通常具有優(yōu)于“原生”JSON的性能。
SQL將繼續(xù)贏得市場份額,并會繼續(xù)看到新的投資和部署。NoSQL數(shù)據(jù)庫提供專有查詢語言或簡單的鍵值語義,而沒有更深層次的技術(shù)差異化。現(xiàn)代SQL系統(tǒng)提供可擴(kuò)展性的同時(shí),還支持更豐富的查詢語義,并有龐大的用戶安裝基礎(chǔ),廣泛的生態(tài)系統(tǒng)整合和深度企業(yè)部署。
三、NoSQL更適合大數(shù)據(jù)應(yīng)用程序
NoSQL越來越多地被認(rèn)為是關(guān)系型數(shù)據(jù)庫的可行替代品,特別是對于大數(shù)據(jù)應(yīng)用程序。此外,無模式數(shù)據(jù)模型通常更適合于現(xiàn)在捕捉和處理的數(shù)據(jù)種類和類型。
當(dāng)我們談?wù)揘oSQL領(lǐng)域的大數(shù)據(jù)時(shí),我們指的是從操作數(shù)據(jù)庫讀取和寫入。不要將操作數(shù)據(jù)庫與分析數(shù)據(jù)庫混淆,這通常會查看大量數(shù)據(jù),并從這些數(shù)據(jù)獲取可視性。
雖然操作數(shù)據(jù)庫的大數(shù)據(jù)看起來不具有可分析性,但操作數(shù)據(jù)庫通常會存儲超大量用戶的大型數(shù)據(jù)集,這些用戶經(jīng)常需要訪問數(shù)據(jù)來實(shí)時(shí)執(zhí)行交易。這種數(shù)據(jù)庫的操作規(guī)模也解釋了NoSQL的關(guān)鍵特性,也就是為什么NoSQL是大數(shù)據(jù)應(yīng)用程序的關(guān)鍵的原因。
四、NoSQL是可擴(kuò)展性的關(guān)鍵
每次技術(shù)行業(yè)經(jīng)歷硬件發(fā)展的根本性轉(zhuǎn)變時(shí),都會出現(xiàn)一個(gè)拐點(diǎn)。在數(shù)據(jù)庫領(lǐng)域,從縱向擴(kuò)展到橫向擴(kuò)展的轉(zhuǎn)變推動了NoSQL的發(fā)展。關(guān)系型數(shù)據(jù)庫(包括來自甲骨文和IBM的數(shù)據(jù)庫)是縱向擴(kuò)展。也就是說,它們是集中式、共享一切的技術(shù),只能通過增加更多昂貴的硬件來擴(kuò)展。
而NoSQL數(shù)據(jù)庫是分布式橫向擴(kuò)展技術(shù)。它們使用了分布式節(jié)點(diǎn)集(稱為集群)來提供高度彈性擴(kuò)展功能,讓用戶可以添加節(jié)點(diǎn)來動態(tài)處理負(fù)載。
分布式橫向擴(kuò)展的做法通常要比縱向做法更加便宜。商業(yè)關(guān)系型數(shù)據(jù)庫的授權(quán)費(fèi)用也讓人望而卻步,因?yàn)樗麄兊膬r(jià)格是按每臺服務(wù)器來計(jì)算。另一方面,NoSQL數(shù)據(jù)庫通常是開源技術(shù),按照運(yùn)行的服務(wù)器集群收費(fèi),而且價(jià)格相對便宜。
五、NoSQL是靈活性的關(guān)鍵
關(guān)系型數(shù)據(jù)庫和NoSQL數(shù)據(jù)模型有很大的不同。關(guān)系型模式獲取數(shù)據(jù),并將數(shù)據(jù)分配到很多相互關(guān)聯(lián)的表中,這些表通過外鍵相互應(yīng)用。
當(dāng)用戶需要對數(shù)據(jù)集運(yùn)行查詢時(shí),所需信息需要從多個(gè)表中收集(通常涉及數(shù)百個(gè)企業(yè)應(yīng)用程序),并結(jié)合這些信息,再提供給應(yīng)用程序。同樣地,當(dāng)寫入數(shù)據(jù)時(shí),需要在多個(gè)表協(xié)調(diào)和執(zhí)行寫入。當(dāng)數(shù)據(jù)相對較少,并且,數(shù)據(jù)以較慢速度流入數(shù)據(jù)庫時(shí),關(guān)系型數(shù)據(jù)庫通常能夠捕捉和存儲信息。然而,現(xiàn)在的應(yīng)用程序通常需要快速寫入(和讀取)海量數(shù)據(jù)。
NoSQL數(shù)據(jù)庫采用非常不同的模式。在其核心,NoSQL數(shù)據(jù)庫其實(shí)是“NoREL”,或者說非關(guān)系型,這意味著它們沒有依賴于表以及表之間的聯(lián)系,以存儲和組織信息。例如,以文檔為導(dǎo)向的NoSQL數(shù)據(jù)庫獲取你想要存儲的數(shù)據(jù),并采用JSON格式整合到文檔中。每個(gè)JSON文檔可以被你的應(yīng)用程序視為一個(gè)對象。JSON文檔可能會提取跨越25個(gè)表的數(shù)據(jù),將數(shù)據(jù)集成到一個(gè)文檔中。
聚合這些信息可能會導(dǎo)致信息重復(fù),但由于存儲已不再是一個(gè)成本問題,數(shù)據(jù)模型靈活性、發(fā)布所產(chǎn)生文檔的簡便性以及讀取和寫入性能提高,讓這成為不錯的選擇。
六、NoSQL是大數(shù)據(jù)應(yīng)用程序的關(guān)鍵
通過第三方(包括社交媒體網(wǎng)站),數(shù)據(jù)正變得越來越容易捕捉和訪問。這些數(shù)據(jù)包括:個(gè)人用戶信息、地理位置數(shù)據(jù)、用戶生產(chǎn)的內(nèi)容、機(jī)器記錄數(shù)據(jù)和傳感器產(chǎn)生的數(shù)據(jù)。企業(yè)還可以依賴于大數(shù)據(jù)來推動其關(guān)鍵任務(wù)型應(yīng)用程序。同時(shí),企業(yè)正在轉(zhuǎn)向到NoSQL數(shù)據(jù)庫,因?yàn)檫@種數(shù)據(jù)庫非常適合現(xiàn)在新型的數(shù)據(jù)類型。
開發(fā)人員想要一個(gè)靈活的數(shù)據(jù)庫,可以很容易適應(yīng)新的數(shù)據(jù)類型,并且,不會受第三方數(shù)據(jù)供應(yīng)商的內(nèi)容結(jié)構(gòu)變化的影響。大多數(shù)新數(shù)據(jù)是非結(jié)構(gòu)化和半結(jié)構(gòu)化,因此,開發(fā)人員也需要能夠有效存儲這些數(shù)據(jù)的數(shù)據(jù)庫。然而,關(guān)系型數(shù)據(jù)庫采用的嚴(yán)格定義的基于模式的做法讓其不可能快速整合新數(shù)據(jù)類型,并且很不適合于非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。
總體來說,隨著web和移動應(yīng)用程序的增加、新的趨勢、網(wǎng)上消費(fèi)者行為的轉(zhuǎn)變以及新的數(shù)據(jù)類型的出現(xiàn),行業(yè)需要能夠提供可擴(kuò)展的靈活的數(shù)據(jù)庫技術(shù)來管理和訪問數(shù)據(jù)。NoSQL技術(shù)是有效滿足這些需求的唯一可行解決方案。

您可能感興趣的文章:
  • Android設(shè)備之間通過Wifi通信的示例代碼
  • Linux系統(tǒng)安裝NoSQL(MongoDB和Redis)步驟及問題解決辦法(總結(jié)篇)
  • 初識NoSQL NoSql數(shù)據(jù)庫入門 NoSql數(shù)據(jù)庫基礎(chǔ)知識
  • 建立在Tablestore的Wifi設(shè)備監(jiān)管系統(tǒng)架構(gòu)實(shí)現(xiàn)

標(biāo)簽:玉溪 廣西 吉林 濟(jì)源 商洛 撫順 瀘州 文山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫選擇:SQL還是NoSQL?》,本文關(guān)鍵詞  大,數(shù)據(jù),時(shí)代,的,數(shù)據(jù)庫,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫選擇:SQL還是NoSQL?》相關(guān)的同類信息!
  • 本頁收集關(guān)于大數(shù)據(jù)時(shí)代的數(shù)據(jù)庫選擇:SQL還是NoSQL?的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章