java解析sina视频

2012年08月10日 分类:学习笔记网络Java

在上一篇java解析youku视频中我们通过解析youku的视频得到了真实的下载地址,这次来看看sina的视频,道理还是一样的,使用firebug来查看web连接,得到记录视频信息的文件。

和上次一样用一个例子来说明,比如这个http://video.sina.com.cn/v/b/75314002-1648211320.html。

用火狐打开,开启firebug,得到如下信息。

firebug

其中在这个请求

>http://v.iask.com/v_play.php?vid=75314002&uid=1648211320&pid=478&tid=&plid=4001&prid=ja_7_3485822616&referrer=&ran=0.2936802236363292&r=video.sina.com.cn  

中得到的响应有我们想要的xml信息,其中vid就是上面红色部分,uid后面的都可以忽略,我们在浏览器中直接输入http://v.iask.com/v_play.php?vid=75314002 还是可以得到相同的信息。自此解析的思路就变清晰了,在视频链接中提取出vid,使用http://v.iask.com/v_play.php?vid= 得到xml文件,解析xml文件就可以得到真实视频地址了。

怎样取得xml文件的java代码就不贴了,下面的是解析xml的代码,使用sax解析xml。首先定义xml reader。

package hdu.fang.parser;

import hdu.fang.model.Video;

import java.util.ArrayList;
import java.util.List;

import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

public class XMLSaxReader extends DefaultHandler {
 private List<Video> videos = null;
 private Video video = null;
 private Long timeLength = null;
 private String tag = null;

 @Override
 public void startDocument() throws SAXException {
  videos = new ArrayList<Video>();
 }

 @Override
 public void startElement(String uri, String localName, String qName,
   Attributes attributes) throws SAXException {
  if ("durl".equals(qName)) {
   video = new Video();
  }

  tag = qName;
 }

 @Override
 public void endElement(String uri, String localName, String qName)
   throws SAXException {
  if ("durl".equals(qName)) {
   videos.add(video);
   video = null;
  }
  tag = null;
 }

 @Override
 public void characters(char[] ch, int start, int length)
   throws SAXException {
  if (tag != null) {
   String data = new String(ch, start, length);
   if ("timelength".equals(tag)) {
    timeLength = Long.valueOf(data);
   } else if ("order".equals(tag)) {
    video.setOrder(Integer.valueOf(data));
   } else if ("url".equals(tag)) {
    video.setUrl(data);
   } else if ("length".equals(tag)) {
    video.setLength(Integer.valueOf(data));
   }
  }
 }

 
 public List<Video> getVideos() {
  return videos;
 }
 
 public long getLength() {
  return timeLength;
 }
}

Video类是我自己定义的一个数据model。在主函数里我们只要调用sax工厂实例化解析器就行了。

SAXParserFactory sf = SAXParserFactory.newInstance();
SAXParser sp = sf.newSAXParser();
XMLSaxReader reader = new XMLSaxReader();
InputStream in_withcode = new ByteArrayInputStream(
 xml.getBytes("UTF-8"));//xml就是刚得到的xml文件,类型String
sp.parse(in_withcode, reader);
videos=reader.getVideos();//得到Video List
timeLength=reader.getLength();//得到视频长度
System.out.println(videos);

在xml文件里还有很多其他信息,都可以解析出来,看自己需要了。

接下来就是Download了,代码就不贴了。

作者:wuyuan 本文来自Wuyuan's Blog 转载请注明,谢谢! 文章地址: http://wuyuans.com/2012/08/parser-sina-video-using-java