主頁 > 知識(shí)庫(kù) > Python使用RethinkDB總結(jié)

Python使用RethinkDB總結(jié)

熱門標(biāo)簽:西安電話自動(dòng)外呼系統(tǒng) 漯河電銷回?fù)芡夂粝到y(tǒng) 電話機(jī)器人怎么看余額 長(zhǎng)沙外呼系統(tǒng)平臺(tái) 怎么修改高德地圖標(biāo)注 美國(guó)地圖標(biāo)注軟件下載 硅基電話機(jī)器人官網(wǎng) 合肥crm外呼系統(tǒng)加盟 城市地圖標(biāo)志怎么標(biāo)注

和 MongoDB 類似 RethinkDB 是一個(gè)主要用來存儲(chǔ) JSON 文檔的數(shù)據(jù)庫(kù)引擎(MongoDB 存儲(chǔ)的是 BSON),可以輕松和多個(gè)節(jié)點(diǎn)連成分布式數(shù)據(jù)庫(kù),非常好用的查詢語言以及支持表的 joins 和 group by 操作等。
昨天試玩了一下 RethinkDB,在一臺(tái)虛擬機(jī)上測(cè)試,插入2500萬行記錄性能比較穩(wěn)定,維持在 1.5K 行到 2K 行每秒之間,RethinkDB 的數(shù)據(jù)分片(sharding)功能非常簡(jiǎn)單,一個(gè)點(diǎn)擊就可以完成。下面的安裝和測(cè)試在 Ubuntu 12.04.4 LTS Server 版本上完成。
加入 RethinkDB 官方源后安裝:

復(fù)制代碼 代碼如下:
$ sudo apt-get install python-software-properties
$ sudo add-apt-repository ppa:rethinkdb/ppa
$ sudo apt-get update
$ sudo apt-get install rethinkdb

拷貝一個(gè)例子配置文件后修改 bind 部分以便可以從其他機(jī)器訪問:
復(fù)制代碼 代碼如下:
$ cd /etc/rethinkdb/
$ sudo cp default.conf.sample instances.d/default.conf

$ sudo vi instances.d/default.conf
...
# bind=127.0.0.1
bind=0.0.0.0
...


啟動(dòng) rethinkdb:
復(fù)制代碼 代碼如下:
$ sudo /etc/init.d/rethinkdb start
rethinkdb: default: Starting instance. (logging to `/var/lib/rethinkdb/default/data/log_file')

訪問 http://192.168.2.39:8080/ 就可以看到 rethinkdb 的管理界面了:

如果不喜歡在命令行工作,web 界面還提供了 Data Explorer 在線查詢工具,支持語法高亮、在線函數(shù)提示等,不用額外查幫助文件。


要用程序的方式和 rethinkdb 打交道的話就需要安裝客戶端驅(qū)動(dòng)(client drivers),官方支持的驅(qū)動(dòng)有 JavaScript, Ruby 和 Python 3種語言,社區(qū)支持的驅(qū)動(dòng)幾乎包括了 C, Go, C++, Java, PHP, Perl, Clojure, Erlang 等所有主流編程語言。本人用 Python 多一些,所以這里安裝 Python 客戶端驅(qū)動(dòng):
復(fù)制代碼 代碼如下:
$ sudo apt-get install python-pip
$ sudo pip install rethinkdb

測(cè)試一下驅(qū)動(dòng)是否能工作了,如果 import rethinkdb 沒有出錯(cuò)基本就可以說明模塊安裝成功:
復(fù)制代碼 代碼如下:
$ python
Python 2.7.3 (default, Feb 27 2014, 19:58:35)
[GCC 4.6.3] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import rethinkdb
>>>

gene2go.txt 是一個(gè)含有基因數(shù)據(jù)的文本文件,大概1000多萬行記錄,格式如下:
復(fù)制代碼 代碼如下:
$ head -2 gene2go.txt
#Format: tax_id GeneID GO_ID Evidence Qualifier GO_term PubMed Category (tab is used as a separator, pound sign - start of a comment)
3702 814629 GO:0005634 ISM - nucleus - Component

寫個(gè)簡(jiǎn)單程序把 gene2go.txt 的數(shù)據(jù)導(dǎo)入到 rethinkdb 里:
復(fù)制代碼 代碼如下:
#!/usr/bin/python
# -*- coding: UTF-8 -*-

import os, os.path, sys, re, csv, string

def csv2db():
    data = csv.reader(open('gene2go.txt', 'rb'), delimiter='\t')
    data.next()

    import rethinkdb as r
    r.connect('localhost', 28015).repl()
    r.db('test').table_create('gene2go').run()
    gene2go = r.db('test').table('gene2go')
    for row in data:
        gene2go.insert({
            'tax_id': row[0],
            'GeneID': row[1],
            'GO_ID': row[2],
            'Evidence': row[3],
            'Qualifier': row[4],
            'GO_term': row[5],
            'PubMed': row[6],
            'Category': row[7]
        }).run(durability="soft", noreply=True)

def main():
    csv2db()

if __name__ == "__main__":
    main()

標(biāo)簽:商洛 瀘州 撫順 廣西 濟(jì)源 玉溪 吉林 文山

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python使用RethinkDB總結(jié)》,本文關(guān)鍵詞  Python,使用,RethinkDB,總結(jié),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python使用RethinkDB總結(jié)》相關(guān)的同類信息!
  • 本頁收集關(guān)于Python使用RethinkDB總結(jié)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章