博客
关于我
Mdrill 测试数据写入程序
阅读量:800 次
发布时间:2023-02-08

本文共 2004 字,大约阅读时间需要 6 分钟。

写入数据到Hadoop分布式文件系统中的TV表数据

最近在项目中需要将大量数据写入Hadoop分布式文件系统中的TV表中,本文将详细介绍SQL表的创建和Java代码实现。

TV表的SQL定义如下:

CREATE TABLE tv (thedate STRING,tv STRING)

Java代码实现:

import java.io.BufferedWriter;import java.io.IOException;import java.io.OutputStreamWriter;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataOutputStream;import org.apache.hadoop.fs.FileSystem;import org.apache.hadoop.fs.Path;

public class ImportData {

private static Configuration conf = null;private static FileSystem fs = null;public static void main(String[] args) throws IOException {    conf = ConfigurationUtil.getConf();    fs = FileSystem.get(conf);    String pathString = "/group/tbdp-etao-adhoc/p4padhoc/tablelist/tv";    Calendar calendar = Calendar.getInstance();    calendar.setTime(new Date());    calendar.set(2013, 1, 1);    SimpleDateFormat sf = new SimpleDateFormat("yyyyMMdd");    while (calendar.get(Calendar.YEAR) < 2014) {        String dateStr = sf.format(calendar.getTime());        String path = pathString + "/dt=" + dateStr;        mkdir(path);        writeTVData(path, dateStr);        calendar.add(Calendar.DAY_OF_YEAR, 1);    }    fs.close();}public static void writeTVData(String dir, String dateStr) throws IOException {    FSDataOutputStream fos = null;    OutputStreamWriter osw = null;    BufferedWriter bw = null;    fos = fs.create(new Path(dir + "/data.txt"), false);    osw = new OutputStreamWriter(fos);    bw = new BufferedWriter(osw);    for (int i = 0; i < 100000; i++) {        StringBuffer strBuffer = new StringBuffer();        strBuffer.append(dateStr);        strBuffer.append((char) 1);        strBuffer.append(i);        strBuffer.append(System.lineSeparator());        bw.write(strBuffer.toString());    }    bw.close();    osw.close();    fos.close();}public static void mkdir(String dir) throws IOException {    Path p = new Path(dir);    if (!fs.exists(p)) {        fs.mkdirs(p);    }}

}

转载地址:http://pmyfk.baihongyu.com/

你可能感兴趣的文章
Mysql Row_Format 参数讲解
查看>>
mysql select, from ,join ,on ,where groupby,having ,order by limit的执行顺序和书写顺序
查看>>
MySQL Server 5.5安装记录
查看>>
mysql server has gone away
查看>>
mysql slave 停了_slave 停止。求解决方法
查看>>
MySQL SQL 优化指南:主键、ORDER BY、GROUP BY 和 UPDATE 优化详解
查看>>
MYSQL sql语句针对数据记录时间范围查询的效率对比
查看>>
mysql sum 没返回,如果没有找到任何值,我如何在MySQL中获得SUM函数以返回'0'?
查看>>
mysql Timestamp时间隔了8小时
查看>>
Mysql tinyint(1)与tinyint(4)的区别
查看>>
mysql union orderby 无效
查看>>
mysql v$session_Oracle 进程查看v$session
查看>>
mysql where中如何判断不为空
查看>>
MySQL Workbench 使用手册:从入门到精通
查看>>
mysql workbench6.3.5_MySQL Workbench
查看>>
MySQL Workbench安装教程以及菜单汉化
查看>>
MySQL Xtrabackup 安装、备份、恢复
查看>>
mysql [Err] 1436 - Thread stack overrun: 129464 bytes used of a 286720 byte stack, and 160000 bytes
查看>>
MySQL _ MySQL常用操作
查看>>
MySQL – 导出数据成csv
查看>>