Web Analytics 浅谈 (1)
版权声明: 允许非商业性转载,但转载时必须标明原作者 fcicq、原始链接 http://www.fcicq.net/wp/?p=906 及本声明。
这个 Blog 上之前部署过好几种统计代码. 这次就谈谈网站分析这个问题.
这篇文章也是为了填一个去年就挖出来的天坑. 原来的主题是 聊聊网页统计.
—
另类统计方法.
最需要说明的是, 不依赖 Cookies 也能做分析. (原题是关于 Cookies, 这句就不改了).
CSS :visited 选择器, 甚至可以批量探测用户可能上过的网站. 最近一些浏览器开始对这个选择器下手了, 把这类问题从源头上堵住.
User-agent, 各类 HTTP Headers (Accept, Accept-Language) 都可以做为浏览器指纹(可以参考 Panopticlick).
If-Modified-Since, 这个方法可以用在图片或者 js 上, 具体应该怎样用别问偶. 这个效果也不错. 重点是要后端有条件提供详细日志(一般日志不行). 这绝对是杀手级的, 只是部署与分析难度大了点. ![]()
phpbb 等一些论坛, sessionid 是挂在链接上的. 当然这相当于 cookies 了.
(不过是把数据存在了服务器上, 由服务器控制记录的时间.)
Yahoo 系(日本?)的网站在链接设计上下了不少功夫, 分析和应用连在一起无法分离.
(delicious 也是这样的, 但 javascript 的启用情况也会影响分析的方式. 关闭 js 使用的是 uri 方法, 开启 js 使用的是 js + 图片分析.)
关于数据存储.
网站有名气了就树大招风, 连 cookies 的过期时间都有人管. 当然偶觉得这个问题不是很重要.
重要的就一个 unique userid, 在数据库里把一切都对应起来好了.
如果有能力的话可以把上面提到的一些分析方法在应用中实现.
偶是觉得 http headers 用一些办法计算指纹是挺容易的. 就看你愿不愿意实现之.
不愿意在分析技术上投钱就罢了. 连最起码的全日志存储都做不到, 就等于… 人家把钱给你了, 你收下一部分然后把另一部分扔了. 也许这个比喻还是不够恰当 ![]()
有些人就纠缠在 Visit, PV, unique visitors 什么的概念上. 所有的日志都在手里, 爱怎么定义怎么定义.
偶承认跨日访问是个难题, 那为什么不能做从本日来的 visitor 总共贡献了多少 PV(这个可以跨日)? 收集几天数据自己就能得到一个大致的 PV 推算关系.
总是想着 0 点出上一天的报表, 是这个问题的来源之一.
都说 Realtime 是趋势, Twitter 什么的都是实时的, 统计为什么不是?
time on site. 这个问题需要说明确吗? mousetracking 都能做.
如果考虑服务器负载问题, 那就用存储法, 在访问下一个页面的时候把上一个页面的情况传回去如何?
这个统计不准确的问题, 应该是有很多方法解决的. 就看你愿不愿意做了.
未完待续.
友情提示: 请注意文章的时效性与准确性, 作者不对文章的有效性负责.
Tags:
Permalink Bookmark on del.icio.us
Last Modified: June 19, 2010 at 1:15 pm