Fault tolerance is a good thing - add some to the migration script
[invirt/scripts/prod-migration.git] / xvm-migrate-machine
old mode 100644 (file)
new mode 100755 (executable)
index f14c1b2..9b08eec
-#!/bin/python
-# Migrates the machine named $1 from the dev cluster.
+#!/usr/bin/python
+# Migrates the machine passed as arguments from the dev cluster.
 # To be run on the prod cluster.
 
-## The present version is NOT A REAL SCRIPT.
-## Things may not even be tested.  Copy and paste.
-not_ready_yet_do_not_run_me
-
-
-from invirt import database
+from invirt import remctl as r
+from lib import database
+import subprocess
+import sys
 
 dev_db_uri = 'postgres://sipb-xen@sipb-xen-dev.mit.edu/sipb_xen'
+database.connect(dev_db_uri)
+dev_sess = database.session
 
+database.connect()
+prod_sess = database.session
 
+## dump from dev db
 def take_data(machine_name):
-## dump from dev db; save info well
-  database.connect(dev_db_uri)
-  database.session.begin()
-  machine = database.Machine.query().get_by(name=machine_name)
-  disks = database.Disk.query().filter_by(machine=machine).all()
-  nics = database.NIC.query().filter_by(machine=machine).all()
-## remove from dev db; ideally atomic with dump
+  dev_sess.begin()
+  machine = dev_sess.query(database.Machine).filter_by(name=machine_name).one()
+  
+  # Clean out the ACL just so we don't have to think about it
+  machine.acl = []
+  dev_sess.update(machine)
+  
+  print 'VM Info:'
+  print '  name: %s' % machine.name
+  print '  description: %s' % machine.description
+  print '  cpus: %s' % machine.cpus
+  print '  memory: %s' % machine.memory
+  print '  owner: %s' % machine.owner
+  print '  contact: %s' % machine.contact
+  print '  administrator: %s' % machine.administrator
+  print '  uuid: %s' % machine.uuid
+  print '  type: %s' % machine.type.type_id
+  print '  autorestart: %s' % machine.autorestart
+  print '  adminable: %s' % machine.adminable
+  print '  Disks:'
+  for disk in machine.disks:
+    print '  - %s (%s)' % (disk.guest_device_name, disk.size)
+  print '  NICs:'
+  for nic in machine.nics:
+    print '  - %s, %s, %s' % (nic.mac_addr, nic.ip, nic.hostname)
+  print '==============================================='
+  print
+  
+  disks = machine.disks
+  nics = machine.nics
   for r in disks + nics + [machine]:
-    database.session.delete(r)
-  database.session.commit()
-  return machine, disks, nics
-
-
-## shut down if up
-#remctl remote control $MACHINE destroy
-
-## copy disk image... copy, copy...
-## for each disk:
-lvname="d_${MACHINE}_${guest_device_name}"
-lvcreate xenvg -n "$lvname" -L "${size}"M
-ssh t-i dd if=/dev/xenvg/"$lvname" of=/dev/stdout bs=1M \
- | dd if=/dev/stdin of=/dev/xenvg/"$lvname" bs=1M
-
-## add to dev db
-def restore_data(machine, disks, nics):
-  database.connect() # to prod DB
-  database.session.begin()
-  ## now copy machine, disks, nics to new ORM objects (yuck, oh well)
-  ## and database.session.save(those)
-  database.session.commit()
-
-
-## power on if desired
+    dev_sess.delete(r)
+  
+  dev_sess.commit()
+  
+  for r in disks + nics + [machine]:
+    dev_sess.expunge(r)
+    del r._instance_key
+  
+  return machine
 
+## add to prod db
+def restore_data(machine, session):
+  # The machine's type is still the one attached to the dev database;
+  # get the right one
+  machine.type = session.query(database.Type).filter_by(type_id=machine.type.type_id).one()
+  session.begin()
+  session.save(machine)
+  session.commit()
+  
+def migrate_vm(machine_name):
+  # Power off the VM on dev
+  #
+  # This has to be done first, because once the machine is deleted
+  # from the database, we can't remctl for it anymore
+  out, err = r.remctl('xvm-remote.mit.edu', 'control', machine_name, 'destroy', err=True)
+  print out
+  
+  machine = take_data(machine_name)
+  
+  success = True
+  ## copy disk image... copy, copy...
+  for disk in machine.disks:
+    lvname='d_%s_%s' % (machine.name, disk.guest_device_name)
+    
+    if 0 != subprocess.call(['lvcreate', '-L%sM' % str(disk.size), '-n', lvname, 'xenvg']):
+      success = False
+    
+    ssh = subprocess.Popen(['ssh', '-o', 'GSSAPIDelegateCredentials=no',
+                'torchwood-institute.mit.edu',
+                'dd', 'if=/dev/xenvg/%s' % lvname, 'bs=1M'],
+                 stdout=subprocess.PIPE)
+    dd = subprocess.Popen(['dd', 'of=/dev/xenvg/%s' % lvname, 'bs=1M'],
+                stdin=ssh.stdout)
+    if 0 != dd.wait():
+      success = False
+    if 0 != ssh.wait():
+      success = False
+  
+  if not success:
+    restore_data(machine, dev_sess)
+    
+    print '==============================================='
+    print 'ERROR: VM %s failed to migrate' % machine.name
+    print '==============================================='
+  else:
+    restore_data(machine, prod_sess)
 
+if __name__ == '__main__':
+  for vm in sys.argv[1:]:
+    print '==============================================='
+    print 'Migrating %s' % vm
+    print '==============================================='
+    migrate_vm(vm.strip())