Kế hoạch điên rồ của cộng đồng Reddit: tạo ra một thư viện lưu trữ toàn bộ bức ảnh trên Instagram

Kế hoạch điên rồ của cộng đồng Reddit: tạo ra một thư viện lưu trữ toàn bộ bức ảnh trên Instagram
Theo: Bảo Nhi Spiderum Theo Trí Thức Trẻ
Thể loại: Khoa Học Công Nghệ
Từ trước đến nay chúng ta vốn vẫn không lạ gì với những dự án vô nghĩa từ cộng đồng Reddit. Mới đây nhất là ý tưởng tạo ra kho lưu trữ phân phối tất cả những tấm ảnh trên Instagram. Instagram, hiện chứa gần 600 TB ảnh từ hàng chục ngàn tài khoản, đang cố gắng dẹp bỏ dự án này.

Đầu năm nay, công ty Project Place đã giúp hàng ngàn người tiêu dùng trải nghiệm mẫu Canvas toàn màn hình trên thiết bị di động (mẫu quảng cáo pop-up trên mạng xã hội), nhưng cùng lúc đó, những thành viên đến từ r/DataHoarder, đại khái đang ấp ủ cho những dự định xa hơn.

DataHoarder là một nhóm người trên Reddit, tự mô tả mình là ‘thủ thư thời kỹ thuật số’.

DataHoarder là một nhóm người trên Reddit, tự mô tả mình là ‘thủ thư thời kỹ thuật số’.

Ý tưởng về kho dữ liệu Instagram đòi hỏi phải sao lưu toàn bộ hình ảnh từ mọi tài khoản công khai (cả tài khoản cá nhân) và lưu trữ chúng trên các ổ cứng trống, chiếm dung lượng của điện toán đám mây. Không rõ tổng kích thước của kho lưu trữ này là bao nhiêu, nhưng với hàng chục triệu bức ảnh được tải lên mạng mỗi ngày, lượng ảnh này có thể lên đến petabytes dữ liệu.

Vậy tại sao lại tự làm khó mình khi thu thập và lưu trữ ảnh từ những người nào đó một cách ngẫu nhiên? Theo người khởi xướng, câu trả lời về cơ bản là 'chỉ bởi vì họ vô tình xuất hiện ở đó.' Có thể đến một ngày nào đó trong tương lai, dự án này sẽ có ý nghĩa thực tế trong việc ngăn chặn hành vi ăn cắp danh tính trực tuyến - trong trường hợp Instagram không thể ngăn chặn nó trước.

Ý tưởng có vẻ điên rồ này đã được đăng lên r/DataHoarder vào ngày 5/1 bởi người kiểm duyệt chuyên mục phụ của Reddit, nickname là Archivist.

Ý tưởng có vẻ điên rồ này đã được đăng lên r/DataHoarder vào ngày 5/1 bởi người kiểm duyệt chuyên mục phụ của Reddit, nickname là Archivist.

Tên thật của anh ấy là John, 20 tuổi, và anh ấy nói rằng thứ lưu trữ không phải Instagram, mà là "đang lưu trữ thứ gì đó khác". Mặc dù John đã làm việc cật lực kể cả ngoài đời và thông qua Internet với Team Archive, hầu hết thời gian của anh đều dành cho các dự án đầy đam mê đăng lên r/DataHoarder, với vai trò ‘thủ thư thời kỹ thuật số’.

"Vậy bây giờ tôi có 300 TB hình ảnh của người khác, nhưng tôi phải làm gì với chúng?"

"Động lực ban đầu của tôi đối với kho lưu trữ Instagram là vì không ai khác làm điều này," John chia sẻ. "Khi bắt đầu tôi đã không có bất kỳ ý tưởng cụ thể nào về những gì tôi muốn làm với dữ liệu thu thập được."

John thường hay gây tranh cãi vì những ý tưởng mới, nhưng ý tưởng lưu trữ Instagram của anh ta vẫn tiếp tục được ủng hộ trên Reddit.

John từng gây tranh cãi khi là người đứng sau dự án kho lưu trữ webcam khiêu dâm.

John từng gây tranh cãi khi là người đứng sau dự án kho lưu trữ webcam khiêu dâm.

Nhiều người nghĩ ý tưởng sử dụng chương trình để sao lưu dữ liệu Instagram có vẻ rất nhàm chán. Nhưng người thu thập dữ liệu đặc biệt hơn người bình thường. Họ có phong cách hiện đại, được ghi nhận là có cách lưu trữ dữ liệu tinh tế, ngay cả một ‘mảnh vụn’ dữ liệu nhỏ trên Internet cũng được xem là đáng ghi nhận vào lịch sử. Vì vậy, John không có vấn đề gì khi tìm kiếm một cộng đồng người sẵn sàng giúp anh ta trong công việc to lớn này - câu hỏi lớn nhất là làm thế nào kiếm họ.

Sau 8 tháng làm việc, anh đã sao lưu được các bài đăng từ khoảng 3.400 tài khoản, chiếm 2,2 triệu tệp - khoảng 633 GB thông tin. Nhưng con số này chẳng đáng là bao, chỉ như một ‘giọt nước giữa đại dương’ bài đăng của Instagram.

Do đó John đã sử dụng một chương trình có mã nguồn mở để trợ giúp dự án nhưng việc tìm kiếm những tài khoản công khai trở nên khó khăn hơn.

Chương trình RipMe thu thập hình ảnh và video từ các tài khoản Instagram công khai.

Chương trình RipMe thu thập hình ảnh và video từ các tài khoản Instagram công khai.

"Bạn có thể vào bất kỳ hồ sơ của ai và xem danh sách những người theo dõi họ, nhưng danh sách này tải được khoảng 20 tài khoản một lần," John nói. "Vì vậy việc thu thập tên người dùng cách thủ công đòi hỏi tôi phải lướt chuột hàng giờ, ban đầu tôi đã giải quyết điều này bằng cách nhét một ít giấy carton vào phím 'page down’ để ‘kẹp chuột’"

Nguyên tắc của dự án này là không thể dựa vào API của Instagram để thu thập thông tin tài khoản vì vi phạm vào các điều khoản dịch vụ của trang web. Cuối cùng, Reddit đã giải quyết vấn đề bằng một vài dòng code cho phép thu thập các bức ảnh từ khoảng 2 triệu tài khoản trong 24 giờ và đưa chúng vào một chương trình khác để chọn lọc lại dữ liệu đúng.

Team của John còn có thể lấy hình ảnh từ một số tài khoản cá nhân. Đầu tiên John đã lập trình một ứng dụng bot tăng like và follow trên Instagram. Chúng sẽ tìm kiếm và theo dõi các tài khoản cá nhân với hy vọng rằng các tài khoản này sẽ theo dõi bot lại, do đó xem được nội dung của họ. Theo John, chiến thuật này đã có tỷ lệ thành công 70%. Tuy nhiên, Instagram chỉ cho phép 7.500 người theo dõi một tài khoản và John đã chán sự chậm chạp này và từ bỏ ý tưởng.

Đã có lúc John làm dự án này một mình. Sau khi tìm ra cách lấy tên người dùng nhanh hơn, anh chỉ việc đưa hàng triệu URL vào chương trình rồi ngồi chờ. "Các dữ liệu chỉ được lưu trữ khi Reddit viết code cho phép mọi người tham gia và kiểm tra các URL so với danh sách chủ để đảm bảo không bị trùng dữ liệu.

Tham gia vào dự án không yêu cầu bất kỳ yêu cầu phần cứng đặc biệt nào, chỉ cần rất nhiều không gian lưu trữ.

"Ngay cả người ít học cũng làm được", John nói. Trở ngại lớn nhất chính là tìm ra một kho chứa vô tận và sau đó biết phải làm gì với chúng. "Chúng tôi vẫn còn khá vô tổ chức, tôi đã nghe một người hỏi nên làm gì với 50 TB dữ liệu và tôi chỉ có thể trả lời là đợi tí, tôi sẽ tìm ra cách…Nhưng bây giờ tôi có đến 300 TB hình ảnh của mọi người, tôi biết làm gì với chúng? "

Câu hỏi này đã làm phẫn nộ một số thành viên r/DataHoarder, vì họ không thoải mái khi một lượng lớn nội dung trên Instagram không được giữ riêng tư. Họ thậm chí đã tố cáo dự án này với Instagram, nhưng nó không vi phạm các điều khoản dịch vụ của công ty, vì vậy John không tiếp nhận bất kỳ lá thư nào.

Tuy nhiên, Instagram dường như không đồng ý. Theo nguồn tin lân cận từ Motherboard, họ cho rằng dự án có vi phạm các điều khoản dịch vụ của nền tảng mạng xã hội và công ty đang từng bước thực hiện dẹp bỏ dự án.

Do vậy, Team của John đang cân nhắc sử dụng kho lưu trữ, chẳng hạn như biến nó thành cơ sở dữ liệu có thể ngăn chặn catfishing, nơi có kẻ ăn cắp hình ảnh từ tài khoản xã hội của người khác và giả mạo danh tính trên mạng, đi lừa gạt mọi người dựa vào mối quan hệ. Anh cũng cho biết có thể tưởng tượng được một tương lai mà Instagram không còn tồn tại, nhưng nội dung mà mọi người đăng tải ở đó vẫn còn giá trị với các nhà sử học.

"Tôi không chắc chắn rằng dự án có giá trị ngay lúc này," John nói. "Chắc chắn, khi Instagram cuối cùng bị khai tử, những người trong thế hệ sau có thể nhìn lại dữ liệu này dưới góc nhìn văn hóa và phân tích xu hướng." Nhưng bây giờ, hầu hết mọi người chỉ nhìn chằm chằm vào tôi với một biểu hiện khó hiểu. "

Nghiên cứu này đã bác bỏ hoàn toàn quan niệm sai lầm "Cứ mỗi khi trái gió trở trời là lại đau nhức hết mình mẩy"

tinybook tinybook 3 tuần 6 ngày
Nghiên cứu này đã bác bỏ hoàn toàn quan niệm sai lầm "Cứ mỗi khi trái gió trở trời là lại đau nhức hết mình mẩy"
Nếu như bạn vẫn tin rằng thời tiết là nguyên nhân khiến các bậc lão thành trong gia đình đau đớn mỗi khi chuyển mùa, thì giờ đây, đã có bằng chứng để chứng minh rằng bạn sai rồi.

Đây là cây cầu được thiết kế để bị ngập một phần mỗi khi trời mưa tại Hà Lan

tinybook tinybook 4 tuần 13 phút
Đây là cây cầu được thiết kế để bị ngập một phần mỗi khi trời mưa tại Hà Lan
Tại thành phố Nijmegen ở Hà Lan, mực nước ngày càng tăng của con sống Waal gần kề đang đe doạ đến cộng đồng dân cư sinh sống tại đây.

Nội dung buổi phỏng vấn cuối cùng của Stephen Hawking bàn bạc về sự kiện thiên văn hiếm có hồi năm ngoái: hai ngôi sao neutron va chạm

tinybook tinybook 4 tuần 13 giờ
Nội dung buổi phỏng vấn cuối cùng của Stephen Hawking bàn bạc về sự kiện thiên văn hiếm có hồi năm ngoái: hai ngôi sao neutron va chạm
Chẳng ai nghĩ rằng đó là buổi phỏng vấn cuối cùng của tượng đài thiên văn học, Stephen Hawking.

Trung Quốc thử nghiệm xe tăng không người lái, điều khiển bằng AI hoặc tay lái truyền thống

tinybook tinybook 4 tuần 14 giờ
Trung Quốc thử nghiệm xe tăng không người lái, điều khiển bằng AI hoặc tay lái truyền thống
Quân đội Trung Quốc đang bắt đầu thử nghiệm các mẫu xe tăng không người lái, có thể điều khiển từ xa dễ dàng bằng trí tuệ nhân tạo hoặc tay lái truyền thống.

Tiếp bước nhiều cơ quan hành pháp tại Mỹ, DEA muốn mua GrayKey, thiết bị bẻ khóa được mọi loại iPhone có giá 30.000 USD một bộ

tinybook tinybook 4 tuần 14 giờ
Tiếp bước nhiều cơ quan hành pháp tại Mỹ, DEA muốn mua GrayKey, thiết bị bẻ khóa được mọi loại iPhone có giá 30.000 USD một bộ
Chiếc hộp nhỏ bé tới từ GrayShift dường như có sức mạnh vô song.

Phát hiện ra ngân hà gần như không có vật chất tối, giới thiên văn học đau đầu không hiểu tại sao

tinybook tinybook 4 tuần 18 giờ
Phát hiện ra ngân hà gần như không có vật chất tối, giới thiên văn học đau đầu không hiểu tại sao
Chúng ta không sai, nhưng có lẽ sẽ phải chỉnh sửa chút khái niệm trong tương lai gần.

Đại học Hawaii tiến gần hơn tới mốc sử dụng 100% năng lượng tái tạo, đầu năm 2019 sẽ có khu vực đầu tiên

tinybook tinybook 4 tuần 1 ngày
Đại học Hawaii tiến gần hơn tới mốc sử dụng 100% năng lượng tái tạo, đầu năm 2019 sẽ có khu vực đầu tiên
Hồi năm 2015, Hawaii là bang đầu tiên của nước Mỹ tuyên bố sẽ đạt được mốc sử dụng năng lượng tái tạo 100% vào năm 2045.

Chuỗi siêu thị Walmart để những con robot tự động chạy quanh các kệ hàng hóa để làm gì?

tinybook tinybook 4 tuần 1 ngày
Chuỗi siêu thị Walmart để những con robot tự động chạy quanh các kệ hàng hóa để làm gì?
Đội ngũ “nhân viên thầm lặng” này đang tạo ra những kết quả tích cực đến các cửa hàng của Walmart.

Bất ngờ phát hiện xác ướp trong một chiếc quan tài tưởng chừng trống rỗng tại viện bảo tàng Úc

tinybook tinybook 4 tuần 1 ngày
Bất ngờ phát hiện xác ướp trong một chiếc quan tài tưởng chừng trống rỗng tại viện bảo tàng Úc
Trước đây chẳng ai quan tâm trong chiếc quan tài đó có chứa gì, bởi các tài liệu liên quan cho biết đây chỉ là một chiếc quan tài 2.500 tuổi trống rỗng mà thôi.

Đột phá trong chữa trị Alzheimer: thử nghiệm thành công kháng thể chữa Alzheimer trên chuột, kết quả cực kì khả quan

tinybook tinybook 4 tuần 1 ngày
Đột phá trong chữa trị Alzheimer: thử nghiệm thành công kháng thể chữa Alzheimer trên chuột, kết quả cực kì khả quan
Nghiên cứu mở đường cho một phương pháp chữa trị ít tác dụng phụ mà cực kì hiệu quả.

Trung Quốc cho rằng vệ tinh rơi sẽ cháy hết trước khi xuống tới Trái Đất, giới khoa học lại lo điều ngược lại

tinybook tinybook 4 tuần 1 ngày
Trung Quốc cho rằng vệ tinh rơi sẽ cháy hết trước khi xuống tới Trái Đất, giới khoa học lại lo điều ngược lại
Vào cuối tuần này, vệ tinh Thiên Cung 1 bị mất kiểm soát của Trung Quốc sẽ rơi xuống Trái Đất. Phía Trung Quốc cho rằng vệ tinh sẽ bị cháy rụi hoàn toàn nhưng giới khoa học lo ngại rằng kích thước của nó quá lớn, sẽ vẫn rơi xuống Trái Đất.

Loài giun dài nhất nhì thế giới này sẽ giúp ta tiêu diệt gián một cách dễ dàng

tinybook tinybook 1 tháng 1 giờ
Loài giun dài nhất nhì thế giới này sẽ giúp ta tiêu diệt gián một cách dễ dàng
Đây sẽ là ác mộng với loài gián, trả thù cho việc loài gián đã làm phiền ta quá lâu rồi.

Elon Musk định bán thêm cả gạch xếp hình, lấy từ chính công trường đào hầm của The Boring Company

tinybook tinybook 1 tháng 9 giờ
Elon Musk định bán thêm cả gạch xếp hình, lấy từ chính công trường đào hầm của The Boring Company
Một viên gạch trúng hai con chim: vừa thêm tiền, lại vừa đổ được phế thải.

MIT vừa chế tạo một con rô bốt cá mập y như thật

tinybook tinybook 1 tháng 1 ngày
MIT vừa chế tạo một con rô bốt cá mập y như thật
Trong tương lai không xa có thể chúng ta rất khó phân biệt đâu là cá thật hay giả vì công nghệ chế tạo rô bốt mới

Đâu sẽ là thiết bị thay thế chiếc smartphone trong tương lai?

tinybook tinybook 1 tháng 1 ngày
Đâu sẽ là thiết bị thay thế chiếc smartphone trong tương lai?
Với tốc độ phát triển chóng mặt của khoa học và công nghệ, rồi sẽ đến lúc triều đại của những chiếc smartphone phải suy tàn...

Với phương pháp làm lạnh dây thần kinh này, từ giờ bạn sẽ chẳng còn lo ngại chuyện tăng cân và béo phì nữa

tinybook tinybook 1 tháng 1 ngày
Với phương pháp làm lạnh dây thần kinh này, từ giờ bạn sẽ chẳng còn lo ngại chuyện tăng cân và béo phì nữa
Bằng cách triệt tiêu tín hiệu từ dạ dày lên não, giờ bạn chẳng còn phải lo ngại chuyện ăn uống vô độ của mình nữa

Máy quét não bây giờ cũng chỉ to bằng một cái mũ bảo hiểm mà thôi!

tinybook tinybook 1 tháng 1 ngày
Máy quét não bây giờ cũng chỉ to bằng một cái mũ bảo hiểm mà thôi!
Các nhà khoa học Anh vừa giới thiệu một máy quét quét não thế hệ mới với kích thước nhỏ gọn và tiện lợi cho phép người đội có thể di chuyển tự do trong quá trình quét, điều này cực kỳ có ý nghĩa với người già và trẻ con mắc các bệnh thần kinh.

Đây là lý do để bạn không nên tin vào những câu chuyện khởi nghiệp, dù nó do chính CEO của hãng nói ra

tinybook tinybook 1 tháng 1 ngày
Đây là lý do để bạn không nên tin vào những câu chuyện khởi nghiệp, dù nó do chính CEO của hãng nói ra
Khi đã thành công, những doanh nhân khởi nghiệp thường có xu hướng thêu dệt câu chuyện thành đạt của mình. Cổ tích giữa đời thường bỗng có thật.

Bác già 61 tuổi tự mình lái thành công quả tên lửa tự chế lên không, nhằm chứng minh Trái Đất phẳng

tinybook tinybook 1 tháng 1 ngày
Bác già 61 tuổi tự mình lái thành công quả tên lửa tự chế lên không, nhằm chứng minh Trái Đất phẳng
"Tôi có tin Trái Đất có hình cái đĩa không á? Tôi tin là có".

Các nhà khoa học khám phá ra lý do vì sao loài gián sống dai đến thế

tinybook tinybook 1 tháng 2 ngày
Các nhà khoa học khám phá ra lý do vì sao loài gián sống dai đến thế
Các nhà khoa học vừa khám phá ra lý do tại sao loài gián lại thích sống trong môi trường bẩn thiểu và cực kỳ khó để tiêu diệt, dường như những thứ đó đã được định sẵn trong ADN của chúng.

Hố sâu nhất Trái Đất: đào 24 năm liền được 12km, còn hơn 6300km nữa mới tới tâm Trái Đất

tinybook tinybook 1 tháng 2 ngày
Hố sâu nhất Trái Đất: đào 24 năm liền được 12km, còn hơn 6300km nữa mới tới tâm Trái Đất
Tại độ sâu ấy, hòn đá vốn cứng cáp lại có đặc tính ... giống nhựa.

Bạn có biết vỏ não của mình chứa tới 17 tỷ cái máy tính không?

tinybook tinybook 1 tháng 2 ngày
Bạn có biết vỏ não của mình chứa tới 17 tỷ cái máy tính không?
Đúng như vậy, mỗi neuron thần kinh của ta là một cỗ máy tính siêu việt.

Chuyện gì xảy ra nếu bạn chia cho 0 trên một cái máy tính cơ?

tinybook tinybook 1 tháng 2 ngày
Chuyện gì xảy ra nếu bạn chia cho 0 trên một cái máy tính cơ?
Không hề giống dòng chữ "Math Error" trên cái máy tính điện tử một chút nào.

Mãn nhãn với màn thử nghiệm nén thép nóng chảy bằng máy ép thủy lực

tinybook tinybook 1 tháng 2 ngày
Mãn nhãn với màn thử nghiệm nén thép nóng chảy bằng máy ép thủy lực
Những khối thép tưởng chừng chắc chắn và cứng cáp là vậy nhưng dưới tác dụng của nhiệt độ và lực nén từ máy ép thủy lực đều dễ dàng bị biến dạng ngay tức khắc.

Hành trình săn lùng kho báu Đức Quốc xã kéo dài đã gần một thế kỷ, đâu là nơi đỗ cuối cùng của những con tàu chở hàng tấn vàng?

tinybook tinybook 1 tháng 2 ngày
Hành trình săn lùng kho báu Đức Quốc xã kéo dài đã gần một thế kỷ, đâu là nơi đỗ cuối cùng của những con tàu chở hàng tấn vàng?
Nhiều người dân địa phương còn sống sót qua Thế chiến II kể rằng, họ đã tận mắt chứng kiến những hàng dài các đoàn xe chất theo vô số kho báu đến khu vực dãy núi Owl Mountains và chưa bao giờ quay trở lại.

Tìm ra những bằng chứng cho thấy thành phố cổ đại này chính là Atlantis trong truyền thuyết

tinybook tinybook 1 tháng 2 ngày
Tìm ra những bằng chứng cho thấy thành phố cổ đại này chính là Atlantis trong truyền thuyết
Nhiều người đồn đại rằng cư dân Atlantis hoặc là hậu duệ của thần thánh, hoặc là người ngoài hành tinh...

Chính việc chụp ảnh selfie sai cách đã khiến mũi bạn to hơn bình thường đến 30%

tinybook tinybook 1 tháng 2 ngày
Chính việc chụp ảnh selfie sai cách đã khiến mũi bạn to hơn bình thường đến 30%
Chẳng có vấn đề gì với nhan sắc của bạn cả - lỗi nằm ở chiếc máy ảnh!

Khoa học trả lời câu hỏi: Cần bao nhiêu tiền để mua hai chữ "hạnh phúc"?

tinybook tinybook 1 tháng 2 ngày
Khoa học trả lời câu hỏi: Cần bao nhiêu tiền để mua hai chữ "hạnh phúc"?
Câu trả lời phụ thuộc hoàn toàn vào việc bạn sống ở đâu trên Trái đất này.

Hội chứng "Trái tim tan vỡ" - khi bạn thực sự có thể chết vì chính cảm xúc của mình

tinybook tinybook 1 tháng 3 ngày
Hội chứng "Trái tim tan vỡ" - khi bạn thực sự có thể chết vì chính cảm xúc của mình
Không chỉ là một ẩn dụ về mặt văn học - hình ảnh trái tim tan vỡ thực sự là một loại bệnh lý đã được y văn ghi nhận.

Stephen Hawking thay đổi tư duy về lỗ đen vũ trụ như thế nào?

tinybook tinybook 1 tháng 3 ngày
Stephen Hawking thay đổi tư duy về lỗ đen vũ trụ như thế nào?
Khi Stephen Hawking đưa ra giả thuyết vào giữa những năm 1970, cho rằng lỗ đen (hố đen) vũ trụ xuất hiện tình trạng “rò rỉ” bức xạ, tan chậm như aspirin tan trong ly nước vậy. Ông đã chính thức “lật đổ” nguyên lý cốt lõi về Vũ trụ.
tinybook Công Nghệ Thông Tin








Chat