mssql-kafka-connector

本文章主要是對開源的kafka-connect-cdc-mssql進(jìn)行編譯并集成到confluent平臺(tái)中,鑒于還不太熟悉部分平臺(tái)的功能,僅簡單介紹此次實(shí)施的步驟。因
1.安裝sql-server的docker image
安裝步驟參考
注意版本以及ubuntu的docker需要root用戶
安裝結(jié)束后使用如下命令進(jìn)入sql server客戶端操作
root@xh:# sqlcmd -S localhost -U SA -P '密碼'  //注意密碼必須是大小寫加特殊字符,否則無法創(chuàng)建dcoker鏡像

  1. 下載并編譯源碼
    使用maven進(jìn)行編譯,你需要提前下載JDBC driver,可自行搜索,下載地址,注意自己的sql-server的JDBC driver版本即可
    之后maven insatll:
    cd ~/Projects/IdeaProjects/kafka-connect-cdc-mssql //x項(xiàng)目所在位置
    $ mvn install:install-file -DgroupId=com.microsoft.sqlserver -DartifactId=sqljdbc4 -Dversion=6.0.7130 -Dpackaging=jar -Dfile=<path to the download> //注意你自己的sqljdbc版本即可
    然后編譯,因?yàn)閠est環(huán)境不同,易出錯(cuò),可使用如下命令:
    $ mvn clean package -Dmaven.test.skip=true
    $ cp ./target/kafka-connect-cdc-mssql-0.0.1-SNAPSHOT.jar ~/workspace/confluent-3.3.0/share/java/kafka-connect-mssql //把生成的jar包放到confluent下的/share/java/自己創(chuàng)建的文件夾下
  2. 啟動(dòng)kafka
    首先啟動(dòng)zookeeper
    cd ~/worksapce/kafka/zookeeper-3.3.6/ //zookeeper的目錄
    bin/zkServer.sh start
    啟動(dòng)kafka
    cd .. //接上,kafka的目錄
    sudo bin/kafka-server-start.sh config/server.properties

以下命令因不涉及到schema-registry,可暫時(shí)忽略不考慮
cd ~/workspace/confluent-3.3.0
./bin/schema-registry-start ./etc/schema-registry/schema-registry.properties

  1. 配置sqlserver.properties
    之后配置mssql-kafka-connector的相關(guān)文件,并在confluent下的etc中創(chuàng)建目錄sqlserver,且在該目錄下創(chuàng)建sqlserver.properties,其內(nèi)容如下:
name=connector1
tasks.max=1
connector.class=com.github.jcustenborder.kafka.connect.cdc.mssql.MsSqlSourceConnector
#connector.class=/home/xh/workspace/confluent-3.3.0/share/java/kafka-connect-mssql/kafka-connect-cdc-mssql-0.0.1-SNAPSHOT.jar

# Set these required values
initial.database=Test
server.name=10.19.138.199
password=Xyj123456.
server.port=1433
username=SA
#topicFormat.format=kafka-mssql
change.tracking.tables=dbo.Inventory2    //注意dbo是schemaName,不要寫成Test(DatabaseName)
  1. 啟動(dòng)mssql-kafka-connector
    $ cd ~/workspace/confluent-3.3.0
    $ bin/connect-standalone etc/kafka/connect-standalone.properties etc/sqlserver/sqlserver.properties
    根據(jù)錯(cuò)誤提示到相應(yīng)的行去找相應(yīng)的maven依賴(~/.m2/repository/下) 并把該依賴jar包c(diǎn)opy到~/workspace/confluent-3.3.0/share/java/kafka-connect-mssql/下,分別如下:

需要的jar包.png

注意其依賴的父類kafka-connector-cdc也需要下載下來且使用maven編譯好,同在該作者的github上。
6.在sql-server中允許database和table的change tracking
參考網(wǎng)址
命令如下:
1>ALTER DATABASE 數(shù)據(jù)庫名 SET CHANGE_TRACKING = ON (CHANGE_RETENTION = 2 DAYS, AUTO_CLEANUP = ON)
2>go
1>ALTER TABLE 表名 ENABLE CHANGE_TRACKING WITH (TRACK_COLUMNS_UPDATED = ON)
2>go
另外會(huì)出現(xiàn)一個(gè)提示要求你允許數(shù)據(jù)庫snapshot隔離,命令如下:
1>ALTER DATABASE 數(shù)據(jù)庫名 SET ALLOW_SNAPSHOT_ISOLATION ON
2>go

  1. 使用該mssql-kafka-connector
    在sql server客戶端插入一條數(shù)據(jù),另開一個(gè)kafka消費(fèi)者的端口,可以看到相應(yīng)的binlog輸出
kafka消費(fèi)者端內(nèi)容.png

接下來要去測試吞吐量和時(shí)延了~Come on!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,537評(píng)論 19 139
  • ** 今天看了一下kafka官網(wǎng),嘗試著在自己電腦上安裝和配置,然后學(xué)一下官方document。** Introd...
    RainChang閱讀 5,143評(píng)論 1 30
  • =========================================================...
    lavor閱讀 3,645評(píng)論 0 5
  • Kafka官網(wǎng):http://kafka.apache.org/入門1.1 介紹Kafka? 是一個(gè)分布式流處理系...
    it_zzy閱讀 4,011評(píng)論 3 53
  • 這一輪的13天,有每天打卡,但每日的自由書寫和高效能人士的七個(gè)習(xí)慣并沒有做完。最近的狀態(tài)有點(diǎn)混沌,不想說那些客觀的...
    樹樹樹樹樹樹閱讀 237評(píng)論 1 2

友情鏈接更多精彩內(nèi)容