« | Main | »

隔离(8): 信息渠道(2)

版权声明: 允许非商业性转载,但转载时必须标明原作者 fcicq、原始链接 http://www.fcicq.net/wp/?p=614 及本声明。

写在前面: 套用隔离的系列, 具体有没有关系, 概不负责, 非常长的一篇牢骚而已 :D

用 iwfwcf 同学对猪的 n (好像只有 5) 个定义开始, 节选其中 3 个.
http://fanfou.com/statuses/Vll_0tjjrck
http://fanfou.com/statuses/mpz9XG1pZUo
http://fanfou.com/statuses/BGolVsoZcLg

这样的 “猪” 的产生, 是由于某些人/组织垄断了信息传播,
并通过各种方式方法压制(那些不希望被传播的)消息的传播.

“人们分享的都是相同的观点和思想,并渐渐确信他们拥有唯一的、正确的答案。”
– 摘 10 招干掉互联网

所以, 跳墙技术, 开放的思想, 两者的重要性, 不用偶说.

兼听则明, 偏听则暗 –《新唐书·魏征传》

===

某些细心的同学应该看见了下面这一段, 稍作了点修改

RSS Reader: bloglines (10+), xianguo (190+, 订的人太少的 feed 用 GR), GR(170+)
(注: 日文技术订阅开始缓慢增加, 所有订阅的 feed 都将从头扫到尾, 所以还有至少 60 feeds 没有完全扫完.
订阅中含不到 10 个 XXX’s Shared items.
设计/web2.0暂时占了不小的分量, 或许能够改变一下.)
Mailing list: Freshmeat, VOA News(正反面消息均有… :D )
Del.icio.us Recommendation System. (专有项目, 每日推荐对偶最重要的 100 – 200 个网页)

SNS 状况:
douban(因为上面没多少人, 所以只需要看首页那几条更新.)
fanfou(最多翻 2 – 3 页而已)
twitter(不常去看)

===

关于上面这两段:

1 如果仔细算的话, 肯定有 300+ 甚至 400+ 个扫完的 feed.
(扫的概念: 看标题, 点开有意思的, 现阶段如果发现非全文输出的使用 Scrapbook 进行收藏.
好东西, 不因为不全文输出, 就不是好东西 — 绕嘴? 这是几个否定?)
2 许多技术文档, 看/扫后偶会很郁闷.
(尤其在有推荐系统之后, 偶会得到更加优秀的实现方法, 而这些实现方法也不断在更新)
3 Shared items 或许是偶前面郁闷的来源. –如果高兴的话可以等着看底下的评论.
4 推荐系统, 果然是小众中的小众.
– 协同过滤应用如此广泛, 推荐系统快成了协同推荐的代名词了. 所以推荐系统不应该使用任何协同算法 :D
– 这样的系统训练很累 :D
5 VOA News.
– 你注意到 CNN 记者是怎样道歉的吗? 回去看看 iwfwcf 同学对猪的定义.

===

推荐系统 和 SNS 是一个矛盾.

偶不否认系统的数据源有比较大的局限性 — 仅限于 del.icio.us 全体用户 & 部分 tags(作为第一层过滤).
早先说过:

当然, 你最喜欢的 blog / 你关注的人, 发你喜欢的文章的概率比较大.
– 偶知道, 有些 blog 对你就是 100%, 不过偶认为这或许是因为你不会判断内容质量.
而这又完全符合目前网民的状况, 比如娱乐性.

内容质量问题, 正如上一篇文章中 cch 同学评论:

去年上手RSS开始一通的订阅。贪
哎 那时候感慨没见过世面 –

(这同样解释了偶看部分技术文档郁闷的问题.)

偶(相对于 RSS)拿到了更多的内容控制权.
– 比如偶可以通过微调的方式, 把 .net, java, windows, sql server, oracle 相关的内容排除掉.

===

虽然知道推荐系统有较多的缺陷, 但这毕竟是打开了一扇通向世界的大门.
就像整天看好友 blog 的同学开始订国外 blog 的 RSS 一样.
– 不过, 这也只是一个高概率问题, 喜欢, 所以订.

===

因为是牢骚, 所以不知道如何结尾了.
就这样结束 :D

ps:
评论的第一个位置有一篇郁闷的样例.

友情提示: 请注意文章的时效性与准确性, 作者不对文章的有效性负责.

Tags:
Bookmark on del.icio.us
Last Modified: April 24, 2008 at 8:20 pm

« | Main | »

3 Comments

  1. fcicq said,

    April 24, 2008 @ 20:25

    郁闷最典型的一篇, chedong 的 memcached 压缩.

    参见 facebook performance caching (pdf, 自己去找)

    可以优化的:
    1 LZO 压缩算法
    2 通过 UDP 传输数据 (丢包率应该不会高, 尤其在同一交换机下)

    他们自己动手丰衣足食 :(

    当然, lzo 是开源项目, memcached udp client, 相信想写, 应该用不了多长时间.
    – 想必有现成的就是没找到 :D

    写在最后: 阅读要仔细, 能做笔记的做笔记, 不能做笔记的? — 做全文索引 :D

  2. charlee said,

    May 9, 2008 @ 11:18

    > 你注意到 CNN 记者是怎样道歉的吗? 回去看看 iwfwcf 同学对猪的定义.
    你也开始八卦了?

  3. fcicq said,

    June 7, 2008 @ 23:08

    大众化的数据, 造就大众化的推荐.

· TrackBack URI