【实战-08】flink消费kafka自定义序列化

软件开发
2025-08-14 17:06:09

目的

让从kafka消费出来的数据，直接就转换成我们的对象

mvn pom  <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http:// .w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>com.boke</groupId> <artifactId>Flink1.7.1</artifactId> <version>1.0-SNAPSHOT</version> <packaging>jar</packaging> <name>Flink Quickstart Job</name> <properties> <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding> <flink.version>1.17.1</flink.version> <target.java.version>1.8</target.java.version> <scala.binary.version>2.12</scala.binary.version> <maven piler.source>${target.java.version}</maven piler.source> <maven piler.target>${target.java.version}</maven piler.target> <log4j.version>2.17.1</log4j.version> </properties> <repositories> <repository> <id>apache.snapshots</id> <name>Apache Development Snapshot Repository</name> <url> repository.apache.org/content/repositories/snapshots/</url> <releases> <enabled>false</enabled> </releases> <snapshots> <enabled>true</enabled> </snapshots> </repository> </repositories> <dependencies>   <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-streaming-java</artifactId> <version>${flink.version}</version>  </dependency> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-clients</artifactId> <version>${flink.version}</version>  </dependency>  <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-kafka</artifactId> <version>${flink.version}</version> </dependency> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-table-api-java</artifactId> <version>${flink.version}</version>  </dependency> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-table-api-java-bridge</artifactId> <version>${flink.version}</version>  </dependency> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-connector-jdbc</artifactId> <version>3.1.0-1.17</version> </dependency> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> <version>8.0.18</version> </dependency>  <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-table-planner-loader</artifactId> <version>${flink.version}</version>  </dependency> <dependency> <groupId>org.apache.flink</groupId> <artifactId>flink-table-runtime</artifactId> <version>${flink.version}</version>  </dependency>  <dependency> <groupId>com.alibaba</groupId> <artifactId>fastjson</artifactId> <version>1.2.83</version> </dependency>     <dependency> <groupId>org.apache.logging.log4j</groupId> <artifactId>log4j-slf4j-impl</artifactId> <version>${log4j.version}</version> <scope>runtime</scope> </dependency> <dependency> <groupId>org.apache.logging.log4j</groupId> <artifactId>log4j-api</artifactId> <version>${log4j.version}</version> <scope>runtime</scope> </dependency> <dependency> <groupId>org.apache.logging.log4j</groupId> <artifactId>log4j-core</artifactId> <version>${log4j.version}</version> <scope>runtime</scope> </dependency> </dependencies> <build> <plugins>  <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compiler-plugin</artifactId> <version>3.1</version> <configuration> <source>${target.java.version}</source> <target>${target.java.version}</target> </configuration> </plugin>   <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-shade-plugin</artifactId> <version>3.1.1</version> <executions>  <execution> <phase>package</phase> <goals> <goal>shade</goal> </goals> <configuration> <createDependencyReducedPom>false</createDependencyReducedPom> <artifactSet> <excludes> <exclude>org.apache.flink:flink-shaded-force-shading</exclude> <exclude>com.google.code.findbugs:jsr305</exclude> <exclude>org.slf4j:*</exclude> <exclude>org.apache.logging.log4j:*</exclude> </excludes> </artifactSet> <filters> <filter>  <artifact>*:*</artifact> <excludes> <exclude>META-INF/*.SF</exclude> <exclude>META-INF/*.DSA</exclude> <exclude>META-INF/*.RSA</exclude> </excludes> </filter> </filters> <transformers> <transformer implementation="org.apache.maven.plugins.shade.resource.ServicesResourceTransformer"/> <transformer implementation="org.apache.maven.plugins.shade.resource.ManifestResourceTransformer"> <mainClass>com.boke.DataStreamJob</mainClass> </transformer> </transformers> </configuration> </execution> </executions> </plugin> </plugins> <pluginManagement> <plugins>  <plugin> <groupId>org.eclipse.m2e</groupId> <artifactId>lifecycle-mapping</artifactId> <version>1.0.0</version> <configuration> <lifecycleMappingMetadata> <pluginExecutions> <pluginExecution> <pluginExecutionFilter> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-shade-plugin</artifactId> <versionRange>[3.1.1,)</versionRange> <goals> <goal>shade</goal> </goals> </pluginExecutionFilter> <action> <ignore/> </action> </pluginExecution> <pluginExecution> <pluginExecutionFilter> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-compiler-plugin</artifactId> <versionRange>[3.1,)</versionRange> <goals> <goal>testCompile</goal> <goal>compile</goal> </goals> </pluginExecutionFilter> <action> <ignore/> </action> </pluginExecution> </pluginExecutions> </lifecycleMappingMetadata> </configuration> </plugin> </plugins> </pluginManagement> </build> </project> 核心代码

package com.boke.kafka;

import com.alibaba.fastjson.JSONObject;

public class Student { public String name; public Integer age;

public Student(String name, Integer age) { this.name = name; this.age = age; } public static Student fromJson(String s){ JSONObject jsonObject = JSONObject.parseObject(s); String name = jsonObject.getString("name"); Integer age = jsonObject.getInteger("age"); return new Student(name,age); } public String getName() { return name; } public void setName(String name) { this.name = name; } public Integer getAge() { return age; } public void setAge(Integer age) { this.age = age; }

}

//下面是main主函数 package com.boke.kafka;

import org.apache.flink.api mon.eventtime.WatermarkStrategy; import org.apache.flink.api mon.typeinfo.TypeHint; import org.apache.flink.api mon.typeinfo.TypeInformation; import org.apache.flink.connector.kafka.source.KafkaSource; import org.apache.flink.connector.kafka.source.enumerator.initializer.OffsetsInitializer; import org.apache.flink.connector.kafka.source.reader.deserializer.KafkaRecordDeserializationSchema; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import org.apache.flink.streaming.connectors.kafka.KafkaDeserializationSchema; import org.apache.kafka.clients.consumer.ConsumerRecord;

import java.nio.charset.StandardCharsets;

public class kafkaSource { public static void main(String[] args) { StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); KafkaSource source = KafkaSource.builder() .setBootstrapServers(“brokers”) .setTopics(“input-topic”) .setGroupId(“my-group”) .setStartingOffsets(OffsetsInitializer.earliest())//【无论如何都从最早开始消费】 // .setStartingOffsets(OffsetsInitializer.latest())//【无论如何都从最新开始消费】 // .setStartingOffsets(OffsetsInitializer mittedOffsets(OffsetResetStrategy.EARLIEST))//【groupid 存在offset 则从offset消费，否则从最早开始消费】 // .setStartingOffsets(OffsetsInitializer mittedOffsets(OffsetResetStrategy.LATEST))//【groupid 存在offset 则从offset消费，否则从最新开始消费】

// .setDeserializer(KafkaRecordDeserializationSchema.of(new KafkaDeserializationSchemaWrapper<>(new SimpleStringSchema()))) // .setDeserializer(KafkaRecordDeserializationSchema.of(new SimpleStringSchema()); .setDeserializer(KafkaRecordDeserializationSchema.of(new MyKafkaDeserializationSchema())) // .setDeserializer(KafkaRecordDeserializationSchema.valueOnly()) .build();

env.fromSource(source, WatermarkStrategy.noWatermarks(), "Kafka Source"); }

} class MyKafkaDeserializationSchema implements KafkaDeserializationSchema{

@Override public boolean isEndOfStream(Student nextElement) { return false; }

//Deserializes the Kafka record. //Params: //record – Kafka record to be deserialized. //Returns: //The deserialized message as an object (null if the message cannot be deserialized). @Override public Student deserialize(ConsumerRecord<byte[], byte[]> record) throws Exception { /* *自定义kafka反序列化 *如果数据异常，可以直接返回nulll即可，源码中有一句英文：null if the message cannot be deserialized * */ String topic = record.topic(); long KafkaTimeStamp = record.timestamp(); int partitionNum = record.partition(); String value = new String(record.value(), StandardCharsets.UTF_8); return Student.fromJson(value); }

@Override public TypeInformation<Student> getProducedType() { return TypeInformation.of(new TypeHint<Student>() {}); }

}

标签：

【实战-08】flink消费kafka自定义序列化由讯客互联软件开发栏目发布，感谢您对讯客互联的认可，以及对我们原创作品以及文章的青睐，非常欢迎各位朋友分享到个人网站或者朋友圈，但转载请说明文章出处“【实战-08】flink消费kafka自定义序列化”

上一篇
用java代码实现QQ第三方登录

下一篇
QT+SQLite数据库配置和使用