博客
关于我
Mdrill 测试数据写入程序
阅读量:800 次
发布时间:2023-02-08

本文共 2004 字,大约阅读时间需要 6 分钟。

写入数据到Hadoop分布式文件系统中的TV表数据

最近在项目中需要将大量数据写入Hadoop分布式文件系统中的TV表中,本文将详细介绍SQL表的创建和Java代码实现。

TV表的SQL定义如下:

CREATE TABLE tv (thedate STRING,tv STRING)

Java代码实现:

import java.io.BufferedWriter;import java.io.IOException;import java.io.OutputStreamWriter;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataOutputStream;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;

public class ImportData {

private static Configuration conf = null;private static FileSystem fs = null;public static void main(String[] args) throws IOException {    conf = ConfigurationUtil.getConf();    fs = FileSystem.get(conf);    String pathString = "/group/tbdp-etao-adhoc/p4padhoc/tablelist/tv";    Calendar calendar = Calendar.getInstance();    calendar.setTime(new Date());    calendar.set(2013, 1, 1);    SimpleDateFormat sf = new SimpleDateFormat("yyyyMMdd");    while (calendar.get(Calendar.YEAR) < 2014) {        String dateStr = sf.format(calendar.getTime());        String path = pathString + "/dt=" + dateStr;        mkdir(path);        writeTVData(path, dateStr);        calendar.add(Calendar.DAY_OF_YEAR, 1);    }    fs.close();}public static void writeTVData(String dir, String dateStr) throws IOException {    FSDataOutputStream fos = null;    OutputStreamWriter osw = null;    BufferedWriter bw = null;    fos = fs.create(new Path(dir + "/data.txt"), false);    osw = new OutputStreamWriter(fos);    bw = new BufferedWriter(osw);    for (int i = 0; i < 100000; i++) {        StringBuffer strBuffer = new StringBuffer();        strBuffer.append(dateStr);        strBuffer.append((char) 1);        strBuffer.append(i);        strBuffer.append(System.lineSeparator());        bw.write(strBuffer.toString());    }    bw.close();    osw.close();    fos.close();}public static void mkdir(String dir) throws IOException {    Path p = new Path(dir);    if (!fs.exists(p)) {        fs.mkdirs(p);    }}

}

转载地址:http://pmyfk.baihongyu.com/

你可能感兴趣的文章
MySQLIntegrityConstraintViolationException异常处理
查看>>
mysqlreport分析工具详解
查看>>
MySQLSyntaxErrorException: Unknown error 1146和SQLSyntaxErrorException: Unknown error 1146
查看>>
Mysql_Postgresql中_geometry数据操作_st_astext_GeomFromEWKT函数_在java中转换geometry的16进制数据---PostgreSQL工作笔记007
查看>>
mysql_real_connect 参数注意
查看>>
mysql_secure_installation初始化数据库报Access denied
查看>>
MySQL_西安11月销售昨日未上架的产品_20161212
查看>>
Mysql——深入浅出InnoDB底层原理
查看>>
MySQL“被动”性能优化汇总
查看>>
MySQL、HBase 和 Elasticsearch:特点与区别详解
查看>>
MySQL、Redis高频面试题汇总
查看>>
MYSQL、SQL Server、Oracle数据库排序空值null问题及其解决办法
查看>>
mysql一个字段为空时使用另一个字段排序
查看>>
MySQL一个表A中多个字段关联了表B的ID,如何关联查询?
查看>>
MYSQL一直显示正在启动
查看>>
MySQL一站到底!华为首发MySQL进阶宝典,基础+优化+源码+架构+实战五飞
查看>>
MySQL万字总结!超详细!
查看>>
Mysql下载以及安装(新手入门,超详细)
查看>>
MySQL不会性能调优?看看这份清华架构师编写的MySQL性能优化手册吧
查看>>