注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

眼睛想旅行

技术就是我的生命与信仰!

 
 
 

日志

 
 
关于我

精通C,C++,python,Erlang。并熟悉各种其他编程语言,用cocos2dx游戏引擎作过几个项目。会MySQL增删改查,了解OpenGL渲染原理。懂单片机,能设计数字电路系统,会画电路图和设计电路板。喜欢了解最新前沿技术,并持续关注和学习新技术。

网易考拉推荐

iOS开发之html解析(转)  

2013-05-25 23:15:27|  分类: ios学习 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

到ios6的时候之前在ios5中用的库文件libxml2.2.7.7不能用了,要改成libxml2或者libxml2.2。我不知道要怎么改,可能下边这个设置就是改法了。

使用XPath解析html

可以从此处https://github.com/topfunky/hpple下载工程,将TFHpple.h,TFHpple.m,TFHppleElement.h,TFHppleElement.m,XPathQuery.h,XPathQuery.m加到自己的项目中,在Frameworks中导入libxml2.x
iOS开发之html解析(转) - ♂苹果 - 眼睛想旅行
 

在项目中找到Other Linker Flags,加入-libxml2
iOS开发之html解析(转) - ♂苹果 - 眼睛想旅行
 

在项目中找到Header Search Paths,加入/usr/include/libxml2
代码如下:

NSString *urlString = nil;

 

urlString = @"http://www.xiyou.edu.cn/new/lm.jsp?urltype=tree.TreeTempUrl&wbtreeid=724";

 

NSData *htmlData = [[NSData alloc] initWithContentsOfURL:[NSURL URLWithString:urlString]];

 

NSData *toHtmlData = [self toUTF8:htmlData];

 

TFHpple *xpathParser = [[TFHpple alloc] initWithHTMLData:toHtmlData];

 

 

NSArray *aArray = [xpathParser searchWithXPathQuery:@"//a"];

 

if ([span count] > 0) {

            

            for (int i = 87; i < 102; i++) {

                            //从<a>的第82个开始取值,共获取15个值

                TFHppleElement *aElement = [aArray objectAtIndex:i];    

                NSArray *aArr = [aElement children];

                TFHppleElement *aEle = [aArr objectAtIndex:0];

                NSArray *aChild = [aEle children];

                TFHppleElement *aChildEle = [aChild objectAtIndex:0];

                NSArray *aChildren = [aChildEle children];

                NSString *aStr = [[aChildren objectAtIndex:0] content];

                NSLog(@"aStr:%@",aStr);

                NSDictionary *aAttributeDict = [aElement attributes];

                NSLog(@"aAttributeDict:%@",aAttributeDict);

                

                            //获取a中的属性值

                NSString *hrefStr = [NSString stringWithFormat:@"http://www.xiyou.edu.cn%@",[aAttributeDict objectForKey:@"href"]];

                NSLog(@"hrefStr:%@",hrefStr);

                

                [currentNewsArr addObject:aStr];

                [currentHrefArr addObject:hrefStr];

                

            }

[htmlData release];

[xpathParser release];

}


//如果解析的网页不是utf8编码,如gbk编码,可以先将其转换为utf8编码再对其进行解析

 

-(NSData *) toUTF8:(NSData *)sourceData {  

    CFStringRef gbkStr = CFStringCreateWithBytes(NULL, [sourceData bytes], [sourceData length], kCFStringEncodingGB_18030_2000, false);  

    

    if (gbkStr == NULL) {  

        return nil;  

    } else {  

        NSString *gbkString = (NSString *)gbkStr; 

        //根据网页源代码中编码方式进行修改,此处为从gbk转换为utf8

             NSString *utf8_String = [gbkString stringByReplacingOccurrencesOfString:@"META http-equiv="Content-Type" content="text/html; charset=GBK""  

                                                                      withString:@"META http-equiv="Content-Type" content="text/html; charset=UTF-8""];  

        

        return [utf8_String dataUsingEncoding:NSUTF8StringEncoding];                             

                                       

}


转自:http://blog.sina.com.cn/s/blog_833996210100yyt4.html
  评论这张
 
阅读(6262)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017