背景
nginx-kafka-module是nginx的一個插件,可以將kafka整合到nginx中,便于web項目中前端頁面埋點數(shù)據(jù)的收集,如前端頁面設(shè)置了埋點,即可將用戶的一些訪問和請求數(shù)據(jù)通過http請求直接發(fā)送到消息中間件kafka中,后端可以通過程序消費kafka中的消息來進(jìn)行實時的計算。比如通過SparkStream來實時的消費Kafka中的數(shù)據(jù)來分析用戶PV,UV、用戶的一些行為及頁面的漏斗模型轉(zhuǎn)化率,來更好的對系統(tǒng)進(jìn)行優(yōu)化或者對來訪用戶進(jìn)行實時動態(tài)的分析。
具體整合步驟
1.安裝git
2.切換到/usr/local/src目錄,然后將kafka的c客戶端源碼clone到本地
cd /usr/local/src
git clone https://github.com/edenhill/librdkafka
3.進(jìn)入到librdkafka,然后進(jìn)行編譯
cd librdkafka
yum install -y gcc gcc-c++ pcre-devel zlib-devel
./configure
make && make install
4.安裝nginx整合kafka的插件,進(jìn)入到/usr/local/src,clone nginx整合kafka的源碼
cd /usr/local/src
git clone https://github.com/brg-liuwei/ngx_kafka_module
5.進(jìn)入到nginx的源碼包目錄下 (編譯nginx,然后將將插件同時編譯)
cd /usr/local/src/nginx-1.12.2
./configure --add-module=/usr/local/src/ngx_kafka_module/
make && make install
6.修改nginx的配置文件:設(shè)置一個location和kafaka的topic,詳情請查看當(dāng)前目錄的nginx.conf
#添加配置(2處)
kafka;
kafka_broker_list f1:9092 f2:9092 f3:9092;
location = /kafka/access {
kafka_topic access888;
}
如下圖:
7.啟動zk和kafka集群(創(chuàng)建topic)
zkServer.sh start
kafka-server-start.sh -daemon config/server.properties
8.啟動nginx,報錯,找不到kafka.so.1的文件
error while loading shared libraries: librdkafka.so.1: cannot open shared object file: No such file or directory
9.加載so庫
#開機(jī)加載/usr/local/lib下面的庫
echo "/usr/local/lib" >> /etc/ld.so.conf
#手動加載
ldconfig
10.測試,向nginx中寫入數(shù)據(jù),然后觀察kafka的消費者能不能消費到數(shù)據(jù)
curl http://localhost/kafka/access -d "message send to kafka topic"
curl http://localhost/kafka/access -d "小偉666"測試
也可以模擬頁面埋點請求接口來發(fā)送信息:
后臺Kafka消費信息如圖:
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。