换ip软件,代理ip软件,更改ip地址-智游代理
首页 IP软件套餐 HTTP代理套餐 API提取 使用帮助 新闻资讯 长效IP 注册 登录 实名验证

在线咨询

800819380 售前客服
在线客服,实时响应

客户经理:
13326404693

473197630 QQ群
473197630

微信客服

您的位置: 首页 > 新闻资讯 > 爬虫代理 > 正文

有关IP和网络代理的几个概念介绍

发布时间:2018年11月14日 来源:智游代理 www.zhiyoudaili.com

今天小编给大家分享一点干货,就关于服务端获取 IP 以及客户端 IP 代理的几个概念简单介绍下。


REMOTE_ADDR

没有使用代理时,就是客户端 IP

使用一层代理时,就是代理 IP

使用多层代理时,就是最终访问服务器的代理 IP

HTTP_VIA

没有使用代理时,没有值

使用代理时,就是代理 IP 

HTTP_X_FORWARDED_FOR

没有使用代理时,没有值

使用一层代理时,就是客户端 IP

使用N层代理时,就是“客户端 IP,第1层代理 IP,...,第(N-1)层代理 IP”,但不包括第N层代理 

透明代理 - Transparent Proxy

REMOTE_ADDR = Proxy IP HTTP_VIA = Proxy IP HTTP_X_FORWARDED_FOR = Your IP

该代理方式只是将信息转发给访问对象,无法达到隐藏真实身份的目的,服务端只需要通过 HTTP_X_FORWARDED_FOR,就可以知道你的真实身份。

匿名代理 - Anonymous Proxy

REMOTE_ADDR = Proxy IP HTTP_VIA = Proxy IP HTTP_X_FORWARDED_FOR = Proxy IP

该代理方式隐藏了您的真实 IP,但是服务端依然知道客户端是通过代理服务访问他们的。

混淆代理 - Distorting Proxy

REMOTE_ADDR = Proxy IP HTTP_VIA = Proxy IP HTTP_X_FORWARDED_FOR = Random IP Address

服务端依然知道客户端是通过代理服务访问他们的,但是通过 HTTP_X_FORWARDED_FOR 获取到的IP地址是一个虚假的随机 IP 地址。

高匿代理 - High Anonymity Proxy

REMOTE_ADDR = Proxy IP HTTP_VIA = Not Determined HTTP_X_FORWARDED_FOR = Not Determined

很明显,采用这种代理方式,服务端如果没有做进一步的校验处理,很容易被客户端欺骗。


这些就是小编的分享了,对于新手是非常有用的,大家记住了吗?

转载注明来自:智游代理IP http://www.zhiyoudaili.com/

相关文章内容简介

1 爬虫使用不同的IP代理为什么效果不一样

我们爬虫在选择IP代理的时候,会发现有特别多的不同的IP提供商,价格差异也很大,从几块钱一天不限量的到几千块钱一天的都有,而且都说自己IP质量很好,都是高匿IP,但是实际使用起来,却发现IP可用率、连通速度都大相径庭,IP代理质量相同怎么效果不同?有些用户反映,在使用IP代理的过程中有时候会遇到这样的情况,即使用同样质量的一批不同的IP代理加上相同的策略访问同一个网站,有的成功有的失败,这是为什么呢?当下很多IP代理池,如果没有特殊注明为独享IP池,都是共享IP池。免费IP代理是最大的共享IP池,面向整个网络用户共享,收费IP代理则是面向自家的付费用户(超低价的普通代理和开放代理等除外,它们本质上还是网上收集的免费IP代理)。既然是共享IP代理池,那么不可避免的就会有冲突发生,会有部分用户使用相同的部分IP访问相同的网站。所以,在使用IP代理访问网站的过程中,会发现有一小部分才刚开始使用,就被反爬策略识别了。那么有什么好的解决办法呢?一是选择购买IP池大的共享IP池,IP池越大,项目冲突的几率就越小;比如智游代理的独享IP池,避免一个IP同时多个... [阅读全文]

2 Python爬虫通过ip代理抓取网页

如果大家在采集网站信息的时候,特别频繁的来访问,非常容易被目标网站检测到从而进行屏蔽,解决这类情况的一种有效的方法就是使用代理IP,当我们连上网络上网的时候,电脑会被分配一个IP,提供给我们使用,如果我们频繁访问一个网站时,这个网站也会因为发现同一个ip地址访问多次而进行屏蔽的,这个时候更换IP地址访问是最好的解决方式,多个ip地址进行随机地轮流访问,减少被该网站检测到的概率。假如我们再使用多个不同的headers请求头,这样就会有多个ip+主机的组合,浏览时被发现的机率又更加降低了。关于代码中ip代理的使用,下面介绍一下:步骤:1、urllib2库中的ProxyHandler类,通过此类可以使用ip代理访问网页proxy_support=urllib2.ProxyHandler({}),其中参数是一个字典{‘类型':'代理ip:端口号'}2、定制、创建一个openeropener=urllib2.build_opener(proxy_support)3、(1)安装openerurlib2.install_opener(o... [阅读全文]

热门标签

推荐阅读

  1. 30

    2018-11

    反爬虫策略去哪找代理IP?

    ​大家应该都听过爬虫和反爬虫吧,它们两就是一对天敌,这么说其实一点都不过分。在大数据时代,数据就是金钱,很多网站为了保护自己网站数据运用了反爬策略。

  2. 06

    2019-10

    分布式爬虫如何解决IP问题

    分布式爬虫如何解决IP问题?大数据时代来临,爬虫工作者的春天也随之来了。然而在我们进行爬虫业务时,却经常受到目标网站反爬虫机制的阻碍,尤其是分布式爬虫,因为采集信息量和采集

  3. 08

    2019-06

    数据采集爬虫代理ip基本原理

    我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常抓取数据,一切看起来都是那么正常,然而一杯茶的功夫可能就会出现错误,比如403 Forbidden,这时候打开网页一看,可

  4. 17

    2019-10

    爬虫代理IP如何使用

    用听说过爬虫的人应该都知道,抓的网站和数据多了,如果爬虫抓取速度过快,很多网站防爬机制总是会碰上的,几乎用的同一招就是封IP。解决方案有2个:1、同一IP,放慢速度(爬取速度慢) 2

  5. 19

    2018-11

    python怎么设置代理ip

    现如今爬虫行业正在如火如荼的发展,在使用爬虫的时候,经常会遇见所要爬取的网站采取了反爬取技术,高强度,高效率的爬取网页信息常常会给网站服务器带来巨大压力

  6. 21

    2018-11

    https代理ip保护网络安全

    互联网急速发展的今天,网络安全急需得到人们重视,因此衍生的https代理ip变得必不可少了。使用代理ip可以保护自己的本地ip,防止被黑被入侵,来保障个人信息以及财产的安全