大数据应用开发——实时数据处理（二）

大数据应用开发——实时数据采集大数据应用开发——实时数据处理Flink完成Kafka中的数据消费，将数据分发至Kafka的dwd层中hadoop，zookeeper，kafka，flink，hbase要开启目录并在HBase中进行备份。

谁呛我名字

350人浏览 · 2024-11-14 09:21:17

谁呛我名字 · 2024-11-14 09:21:17 发布

前言

大数据应用开发——大数据平台集群部署

安装spark和zookeeper、hbase

大数据应用开发——实时数据采集

大数据应用开发——实时数据处理

Flink完成Kafka中的数据消费，将数据分发至Kafka的dwd层中

并在HBase中进行备份

大数据应用开发——数据可视化

hadoop，zookeeper，kafka，flink，hbase要开启

public class HbaseSink implements SinkFunction<String> {
    @Override
    public void invoke(String value, Context context) throws Exception {
        Connection connection = null;
        Table table = null;

        try{
            Configuration configuration = HBaseConfiguration.create();
            configuration.set("hbase.zookeeper.quorum", "master,slave1,slave2");
            configuration.set("hbase.zookeeper.property.clientPort", "2181");
            connection = ConnectionFactory.createConnection(configuration);
            TableName tableName = TableName.valueOf("user");
            table = connection.getTable(tableName);
            //O:1,12564,O,45,2024-10-26,3-MEDIUM,Clerk#000000296,1,ggle. special, final requests are against the furiously specia
            //L:1,41,23,62,71,40,84,77,R,O,2024-10-26,2024-10-26,2024-10-26,DELIVER IN PERSONRAILquickly. bold deposits sleep slyly. packages use slyly
            String[] strings = value.split(",");
            if (strings[0].substring(0,1).equals("O")){
                for (int i = 1; i < 9; i++) {
                    Put put = new Put(Bytes.toBytes(strings[0]));
                    put.addColumn(Bytes.toBytes("base_info"),Bytes.toBytes("info"+i),Bytes.toBytes(strings[i]));
                    table.put(put);
                }
            }else {
                for (int i = 1; i < 14; i++) {
                    Put put = new Put(Bytes.toBytes(strings[0]));
                    put.addColumn(Bytes.toBytes("base_info"),Bytes.toBytes("info"),Bytes.toBytes(strings[i]));
                    table.put(put);
                }
            }
        }finally {
            if(table != null){table.close();}
            if(connection != null){connection.close();}
        }
    }
}

PS：hbase里如果没有user表，要创建

hbase shell

create ‘表名’,‘列簇’

在main中将 HbaseSink 添加

		map.addSink(new HbaseSink());
		// execute program
		env.execute("Flink Streaming Java API Skeleton");

将代码打包成.jar，放进主节点运行

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

自动化提示词生成工具盘点

腾讯云开发者社区

AI PPT免费使用技巧盘点：如何快速制作专业PPT？

腾讯云开发者社区

腾讯云架构师技术沙龙 · 长沙站圆满落幕，共话AI驱动下的技术架构与前沿应用

人工智能已成为推动技术创新与产业变革的重要引擎，开发者正身处一场前所未有的技术变革之中。通过本次腾讯云架构师技术沙龙，各位专家深入分享前沿技术洞察，探讨 AI 落地的应用路径与实践经验，为架构师的职业发展指明方向。腾讯云架构师长沙同盟和腾讯云架构师技术同盟长沙地区理事会正式成立。未来，腾讯云架构师长沙同盟将凝心聚力，打造属于本地架构师的学习与成长的家园，助力中国架构的蓬勃发展。未来已来，让我们携手