entrées multiples sur logstash jdbc

Question

J'utilise logstash jdbc pour garder les choses synchronisées entre mysql et elasticsearch. Son fonctionne bien pour une table. Mais maintenant, je veux le faire pour plusieurs tables. Dois-je ouvrir plusieurs terminaux

logstash agent -f /Users/logstash/logstash-jdbc.conf

chacun avec une requête de sélection ou avons-nous une meilleure façon de le faire afin que nous puissions avoir plusieurs tables mises à jour.

mon fichier de configuration

input { jdbc { jdbc_driver_library => "/Users/logstash/mysql-connector-Java-5.1.39-bin.jar" jdbc_driver_class => "com.mysql.jdbc.Driver" jdbc_connection_string => "jdbc:mysql://localhost:3306/database_name" jdbc_user => "root" jdbc_password => "password" schedule => "* * * * *" statement => "select * from table1" } } output { elasticsearch { index => "testdb" document_type => "table1" document_id => "%{table_id}" hosts => "localhost:9200" } }

Val · Accepted Answer

Vous pouvez certainement avoir une seule configuration avec plusieurs entrées jdbc, puis paramétrer les index et document_type dans votre sortie elasticsearch selon la table d'où provient l'événement.

input { jdbc { jdbc_driver_library => "/Users/logstash/mysql-connector-Java-5.1.39-bin.jar" jdbc_driver_class => "com.mysql.jdbc.Driver" jdbc_connection_string => "jdbc:mysql://localhost:3306/database_name" jdbc_user => "root" jdbc_password => "password" schedule => "* * * * *" statement => "select * from table1" type => "table1" } jdbc { jdbc_driver_library => "/Users/logstash/mysql-connector-Java-5.1.39-bin.jar" jdbc_driver_class => "com.mysql.jdbc.Driver" jdbc_connection_string => "jdbc:mysql://localhost:3306/database_name" jdbc_user => "root" jdbc_password => "password" schedule => "* * * * *" statement => "select * from table2" type => "table2" } # add more jdbc inputs to suit your needs } output { elasticsearch { index => "testdb" document_type => "%{type}" # <- use the type from each input hosts => "localhost:9200" } }

iNandi · Answer

Cela ne créera pas de données en double. et logstash compatible 6x.

# YOUR_DATABASE_NAME : test # FIRST_TABLE : place # SECOND_TABLE : things # SET_DATA_INDEX : test_index_1, test_index_2 input { jdbc { # The path to our downloaded jdbc driver jdbc_driver_library => "/mysql-connector-Java-5.1.44-bin.jar" jdbc_driver_class => "com.mysql.jdbc.Driver" # Postgres jdbc connection string to our database, YOUR_DATABASE_NAME jdbc_connection_string => "jdbc:mysql://localhost:3306/test" # The user we wish to execute our statement as jdbc_user => "root" jdbc_password => "" schedule => "* * * * *" statement => "SELECT @slno:=@slno+1 aut_es_1, es_qry_tbl.* FROM (SELECT * FROM `place`) es_qry_tbl, (SELECT @slno:=0) es_tbl" type => "place" add_field => { "queryFunctionName" => "getAllDataFromFirstTable" } use_column_value => true tracking_column => "aut_es_1" } jdbc { # The path to our downloaded jdbc driver jdbc_driver_library => "/mysql-connector-Java-5.1.44-bin.jar" jdbc_driver_class => "com.mysql.jdbc.Driver" # Postgres jdbc connection string to our database, YOUR_DATABASE_NAME jdbc_connection_string => "jdbc:mysql://localhost:3306/test" # The user we wish to execute our statement as jdbc_user => "root" jdbc_password => "" schedule => "* * * * *" statement => "SELECT @slno:=@slno+1 aut_es_2, es_qry_tbl.* FROM (SELECT * FROM `things`) es_qry_tbl, (SELECT @slno:=0) es_tbl" type => "things" add_field => { "queryFunctionName" => "getAllDataFromSecondTable" } use_column_value => true tracking_column => "aut_es_2" } } # install uuid plugin 'bin/logstash-plugin install logstash-filter-uuid' # The uuid filter allows you to generate a UUID and add it as a field to each processed event. filter { mutate { add_field => { "[@metadata][document_id]" => "%{aut_es_1}%{aut_es_2}" } } uuid { target => "uuid" overwrite => true } } output { stdout {codec => rubydebug} if [type] == "place" { elasticsearch { hosts => "localhost:9200" index => "test_index_1_12" #document_id => "%{aut_es_1}" document_id => "%{[@metadata][document_id]}" } } if [type] == "things" { elasticsearch { hosts => "localhost:9200" index => "test_index_2_13" document_id => "%{[@metadata][document_id]}" # document_id => "%{aut_es_2}" # you can set document_id . otherwise ES will genrate unique id. } } }

zabusa · Answer

Si vous devez exécuter plusieurs pipelines dans le même processus, Logstash fournit un moyen de le faire via un fichier de configuration appelé pipelines.yml et en utilisant plusieurs pipelines

pipeline multiple

L'utilisation de plusieurs pipelines est particulièrement utile si votre configuration actuelle comporte des flux d'événements qui ne partagent pas les mêmes entrées/filtres et sorties et sont séparés les uns des autres à l'aide de balises et de conditions.

ressource plus utile