换ip软件,代理ip软件,更改ip地址-智游代理
首页 IP软件套餐 HTTP代理套餐 API提取 使用帮助 新闻资讯 长效IP 注册 登录 实名验证

在线咨询

800819380 售前客服
在线客服,实时响应

客户经理:
13326404693

473197630 QQ群
473197630

微信客服

您的位置: 首页 > 新闻资讯 > 爬虫代理 > 正文

爬虫ip代理有哪些分类

发布时间:2018年10月07日 来源:智游代理 www.zhiyoudaili.com

对于爬虫来说,由于爬虫爬取速度过快,在爬取过程中可能遇到同一个IP访问过于频繁的问题,此时网站就会让我们输入验证码登录或者直接封锁IP,这样会给爬取带来极大的不便。使用代理隐藏真实的IP,让服务器误以为是代理服务器在请求自己。这样在爬取过程中通过不断更换代理,就不会被封锁,可以达到很好的爬取效果。

 

代理分类时,既可以根据协议区分,也可以根据其匿名程度区分。

 

(1)根据代理的协议,代理可以分为如下类别。

 

1.FTP代理服务器:主要用于访问FTP服务器,一般有上传、下载以及缓存功能,端口一般为212121等。

2.HTTP代理服务器:主要用于访问网页,一般有内容过滤和缓存功能,端口一般为8080803128等。

3.SSL/TLS代理:主要用于访问加密网站,一般有SSLTLS加密功能(最高支持128位加密强度),端口一般为443

4.RTSP代理:主要用于访问Real流媒体服务器,一般有缓存功能,端口一般为554

5.Telnet代理:主要用于telnet远程控制(黑客入侵计算机时常用于隐藏身份),端口一般为23

6.POP3/SMTP代理:主要用于POP3/SMTP方式收发邮件,一般有缓存功能,端口一般为110/257.SOCKS代理:只是单纯传递数据包,不关心具体协议和用法,所以速度快很多,一般有缓存功能,端口一般为1080SOCKS代理协议又分为SOCKS4SOCKS5,前者只支持TCP,而后者支持TCPUDP,还支持各种身份验证机制、服务器端域名解析等。简单来说,SOCK4能做到的SOCKS5都可以做到,但SOCKS5能做到的SOCK4不一定能做到。 爬虫代理分类有哪些?

 

(2)根据匿名程度


根据代理的匿名程度,代理可以分为如下类别。

 

1.高度匿名代理:会将数据包原封不动地转发,在服务端看来就好像真的是一个普通客 户端在访问,而记录的IP是代理服务器的IP

 

2.普通匿名代理:会在数据包上做一些改动,服务端上有可能发现这是个代理服务器,也有一定几率追查到客户端的真实IP。代理服务器通常会加入的HTTP头有HTTP_VIAHTTP_X_FORWARDED_FOR

 

3.透明代理:不但改动了数据包,还会告诉服务器客户端的真实IP。这种代理除了能用缓存技术提高浏览速度,能用内容过滤提高安全性之外,并无其他显著作用,最常见的例子是内网中的硬件防火墙。

 

4.间谍代理:指组织或个人创建的用于记录用户传输的数据,然后进行研究、监控等目的的代理服务器。

转载注明来自:智游代理IP http://www.zhiyoudaili.com/

相关文章内容简介

1 爬虫用自建代理效果怎么样

爬虫是抓取数据的主要途径,现在很多企业都需要。但由于反爬虫的限制,想让爬虫顺利进行就要用代理IP,那么,爬虫用自建代理效果怎么样?自建服务器来获取代理IP的方法很好,稳定性也很强,但是需要大量的服务器。但是在正常情况下,爬虫用户并没有技术能力去维护服务器,这是因为对技术要求和成本都很高。作为用户来说,没有资源,也没有技术,所以并不推荐爬虫用户自建代理。现在有很多可以提供代理IP的商家,提供的IP质量都不错,并且稳定性也不错,所以建议爬虫用户试试付费的代理IP。如果没有目标,可以尝试智游代理,可以提供IP资源,还可以根据用户的需求来制定套餐,用来爬虫稳定又高效。... [阅读全文]

2 使用代理IP做爬虫的正确姿势

  没有被封过IP的爬虫工程师,肯定不是一个好的工程师。在爬虫工作的过程中,总是会遇到封IP的烦心事,今天这样爬,被封,明天那样爬,还是被封,到底要怎样爬呢,才不会被封。  很多人认为之所以被封IP,是因为爬取的太快了,确实是这样。那好吧,我就放慢速度,依然被封,再放慢速度,再被封,再再放慢速度,终于不被封了,但这速度和蜗牛没什么差别了,爬虫失去了它存在的意义。  很多人想到了使用代理IP来做爬虫,提升速度爬,被封,再换一个IP,再被封,再再换,再再被封,进入了“封了一个IP,还有千千万万IP”模式,工作效率终于提高了。  但这种方法也有一个致命的问题,上哪找这么多高效稳定的代理IP?  有人很快行动,写了个爬虫爬取网上的代理IP,然后筛选验证,最后封装在IP池里。结果发现,这种方法效率太低,IP质量太低,当然花费的成本也最低,只不过时间成本最高。  也有人迟疑,在网上经过各种筛选,找到了收费的代理IP,购买了一批。结果发现,这种方法一般般,勉强可以正常工作,但还达不到自己的预期,不是理想中的完美解决方案。  终于,有人找到了智游代理IP平台上的... [阅读全文]

热门标签

推荐阅读

  1. 26

    2020-03

    分布式爬虫使用代理IP有哪些方案

    没有代理IP,爬虫工作将寸步难行,所以很多爬虫工程师都需要去选购高效稳定的代理IP。有了优质代理IP后,是不是就可以高枕无忧了呢?事情没有那么简单,还需要优化方案,合理分配资源,

  2. 12

    2018-11

    什么爬虫代理ip更受人们欢迎?

    在网络爬虫抓取信息的过程中,如果抓取频率高过了网站的设置阀值,将会被禁止访问。通常,网站的反爬虫机制都是依据IP来标识爬虫的,解决方法就是使用代理IP。

  3. 18

    2019-06

    爬虫不使用代理容易出现的问题

    大数据时代来临,爬虫独步天下,混得有声有色,然而,一物降一物,反爬虫应运而生,并且不断进化,爬虫工作举步维艰,若不能升级、进化,只能被淘汰。除了不断优化升级爬虫,很多爬虫

  4. 16

    2019-10

    为什么有些爬虫代理ip重复率很高?

    为什么有些爬虫代理ip重复率很高?做爬虫的久了,会接触到很多很多爬虫代理ip提供商家,也会发现不同提供商的http代理质量差别非常大,有些代理商的重复率非常高,导致爬虫被封,这是为

  5. 24

    2018-11

    网络业务的助力——代理ip

    互联网时代,网络发展很快,很多人从事网络方面工作,如果你是网络业务的话,一定不要错过这篇文章,因为这篇文章介绍了一件神器,可以帮助你提高业务的完成效率。

  6. 19

    2018-11

    网络爬虫必须要用代理IP吗?

    互联网科技发展到今天,很多朋友都已经了解或者使用过代理ip了,适用于直播投票、刷浏览量、网络爬虫等工作。